102 lines
4.1 KiB
PHP
102 lines
4.1 KiB
PHP
#!/usr/bin/php -c/var/www/batch/config/php_batch_sd.ini
|
|
<?php
|
|
include_once(FWK_PATH.'common/chiffres.php');
|
|
include_once(FWK_PATH.'common/dates.php');
|
|
include_once(INCLUDE_PATH.'insee/classMInsee.php');
|
|
|
|
$directory='/home/data/autre/email_web/';
|
|
|
|
$iDb=new WDB('jo');
|
|
$iInsee=new MInsee();
|
|
$tabFichier=array();
|
|
|
|
$dh = opendir($directory);
|
|
while (false !== ($filename = readdir($dh))) {
|
|
if ($filename<>'.' && $filename<>'..' && substr($filename, -5)=='.html')
|
|
$tabFichier[] = $filename;
|
|
}
|
|
sort($tabFichier);
|
|
print_r($tabFichier);
|
|
|
|
for ($i=0; isset($tabFichier[$i]); $i++)
|
|
{
|
|
$nomFichier =$tabFichier[$i];
|
|
|
|
$html=file_get_contents($directory.$nomFichier);
|
|
if (preg_match_all('/<tr(?:.*)<td class="cltd1"> (.*) <\/td>(?:.*)<td class="cltd18"> (.*)<\/td>(?:.*)<td class="cltd19"> (.*)<\/td>(?:.*)<td class="cltd20"> <a href="mailto\:(.*)"(?:.*)<\/a>(?:.*)<\/td>(?:.*)<td class="cltd21"> <a href="(.*)">(?:.*)<\/a>(?:.*)<\/tr>/Uis', $html, $matches)) {
|
|
//print_r($matches);
|
|
foreach($matches[1] as $j=>$siret) {
|
|
$tmp=explode(' ', $siret);//300032513 99
|
|
$siren=$tmp[0];
|
|
$nic=$tmp[1];
|
|
$tel=traiteStr($matches[2][$j]);
|
|
$fax=traiteStr($matches[3][$j]);
|
|
$mel=traiteStr($matches[4][$j]);
|
|
$pos = strpos($mel, '@');
|
|
if ($pos==0) $mel='';
|
|
$mel=preg_replace('/^.*\%22\%20\%3C/','', $mel);
|
|
$mel=preg_replace('/(Mr|Mme)\%20.*$/U','', $mel);
|
|
//tourasse@club-internet.frMr%20Jeanpierre%20Eric
|
|
$web=traiteStr($matches[5][$j]);
|
|
if ($tel || $fax || $mel || $web) {
|
|
$tabIdentite=@$iInsee->getIdentiteEntreprise($siren, $nic, 0, false,false);
|
|
//print_r($tabIdentite);
|
|
$tel2=$fax2=$web2=$mail2=$newWeb=$newMel='';
|
|
$tel2=@$tabIdentite['Tel'];
|
|
$fax2=@$tabIdentite['Fax'];// => 05 61 99 02 14
|
|
$web2=@$tabIdentite['Web'];// => www.infotechlog.com
|
|
$mel2=@$tabIdentite['Mail'];
|
|
//echo "==> EN BASE\t$i\t$siren\t$nic\t$tel2\t$fax2\t$mel2\t$web2".EOL;
|
|
if ($web=='' && $web2<>'') $newWeb=$web2; else $newWeb=$web;
|
|
if ($mel=='' && $mel2<>'') $newMel=$mel2; else $newMel=$mel;
|
|
$ret=$iDb->select('infos_entrep', 'siren, nic, web, mail, tel, fax', "siren=$siren");
|
|
if ($ret[0]['siren']*1==0) {
|
|
echo "$nomFichier\t$i\t$siren\t$nic\t$tel\t$fax\t$mel\t$web\t";
|
|
$tabIdentitePart=@$iInsee->getIdentitePart($siren, '', '', '', $nic, true);
|
|
print_r($tabIdentite);
|
|
echo EOL.EOL.EOL.EOL;
|
|
die(print_r($tabIdentitePart));
|
|
|
|
$ret=$iDb->select('infos_entrep', 'siren, nic, web, mail, tel, fax', "siren=$siren");
|
|
if ($ret[0]['siren']*1==0) {
|
|
$iDb->update('infos_entrep', array('web'=>$newWeb,'mail'=>$newMel), "siren=$siren");
|
|
echo 'maj ok';
|
|
} else
|
|
echo 'MAJ KO !!!';
|
|
echo EOL;
|
|
}
|
|
}
|
|
/*
|
|
if ($tabIdentite['Actif']==1) {
|
|
$tdeb=microtime(1);
|
|
$iTel=new MTel();
|
|
$tmp=$iTel->getTel($siren);
|
|
if (count($tmp)>0 && $nic*1>0) {
|
|
$tmp=$iTel->getTel($siren, $nic);
|
|
$sirenTrouve=true;
|
|
$siretTrouve++;
|
|
} else
|
|
$sirenTrouve=false;
|
|
if ($iTel->enCache)
|
|
$siretEnCache++;
|
|
$duree=round(microtime(1)-$tdeb,3);
|
|
|
|
|
|
$iDb->select('telephonie', 'dateProvPartenaire, typeTel, infoTel varchar(255) latin1_swedish_ci Non Affiche les valeurs distinctes Modifier Supprimer Primaire Unique Index Texte entier
|
|
telephone int(10) UNSIGNED ZEROFILL Non 0000000000 Affiche les valeurs distinctes Modifier Supprimer Primaire Unique Index Texte entier
|
|
actif tinyint(1) UNSIGNED Non Affiche les valeurs distinctes Modifier Supprimer Primaire Unique Index Texte entier
|
|
partenaire tinyint(1) UNSIGNED Non 0 Affiche les valeurs distinctes Modifier Supprimer Primaire Unique Index Texte entier
|
|
dateInsert
|
|
*/
|
|
}
|
|
//die();
|
|
}
|
|
}
|
|
die();
|
|
|
|
function traiteStr($str) {
|
|
if ($str=='http://') return '';
|
|
return trim(strtr($str, array(' '=>'', '%40'=>'@', '%22%22%20%3C'=>'', '%3E?subject=bonjour%20'=>'', )));
|
|
//
|
|
}
|
|
?>
|