batch/1.1/old/readDirectory.php
2012-10-16 07:44:31 +00:00

102 lines
4.1 KiB
PHP

#!/usr/bin/php -c/var/www/batch/config/php_batch_sd.ini
<?php
include_once(FWK_PATH.'common/chiffres.php');
include_once(FWK_PATH.'common/dates.php');
include_once(INCLUDE_PATH.'insee/classMInsee.php');
$directory='/home/data/autre/email_web/';
$iDb=new WDB('jo');
$iInsee=new MInsee();
$tabFichier=array();
$dh = opendir($directory);
while (false !== ($filename = readdir($dh))) {
if ($filename<>'.' && $filename<>'..' && substr($filename, -5)=='.html')
$tabFichier[] = $filename;
}
sort($tabFichier);
print_r($tabFichier);
for ($i=0; isset($tabFichier[$i]); $i++)
{
$nomFichier =$tabFichier[$i];
$html=file_get_contents($directory.$nomFichier);
if (preg_match_all('/<tr(?:.*)<td class="cltd1">&nbsp;(.*)&nbsp;<\/td>(?:.*)<td class="cltd18">&nbsp;(.*)<\/td>(?:.*)<td class="cltd19">&nbsp;(.*)<\/td>(?:.*)<td class="cltd20">&nbsp;<a href="mailto\:(.*)"(?:.*)<\/a>(?:.*)<\/td>(?:.*)<td class="cltd21">&nbsp;<a href="(.*)">(?:.*)<\/a>(?:.*)<\/tr>/Uis', $html, $matches)) {
//print_r($matches);
foreach($matches[1] as $j=>$siret) {
$tmp=explode(' ', $siret);//300032513 99
$siren=$tmp[0];
$nic=$tmp[1];
$tel=traiteStr($matches[2][$j]);
$fax=traiteStr($matches[3][$j]);
$mel=traiteStr($matches[4][$j]);
$pos = strpos($mel, '@');
if ($pos==0) $mel='';
$mel=preg_replace('/^.*\%22\%20\%3C/','', $mel);
$mel=preg_replace('/(Mr|Mme)\%20.*$/U','', $mel);
//tourasse@club-internet.frMr%20Jeanpierre%20Eric
$web=traiteStr($matches[5][$j]);
if ($tel || $fax || $mel || $web) {
$tabIdentite=@$iInsee->getIdentiteEntreprise($siren, $nic, 0, false,false);
//print_r($tabIdentite);
$tel2=$fax2=$web2=$mail2=$newWeb=$newMel='';
$tel2=@$tabIdentite['Tel'];
$fax2=@$tabIdentite['Fax'];// => 05 61 99 02 14
$web2=@$tabIdentite['Web'];// => www.infotechlog.com
$mel2=@$tabIdentite['Mail'];
//echo "==> EN BASE\t$i\t$siren\t$nic\t$tel2\t$fax2\t$mel2\t$web2".EOL;
if ($web=='' && $web2<>'') $newWeb=$web2; else $newWeb=$web;
if ($mel=='' && $mel2<>'') $newMel=$mel2; else $newMel=$mel;
$ret=$iDb->select('infos_entrep', 'siren, nic, web, mail, tel, fax', "siren=$siren");
if ($ret[0]['siren']*1==0) {
echo "$nomFichier\t$i\t$siren\t$nic\t$tel\t$fax\t$mel\t$web\t";
$tabIdentitePart=@$iInsee->getIdentitePart($siren, '', '', '', $nic, true);
print_r($tabIdentite);
echo EOL.EOL.EOL.EOL;
die(print_r($tabIdentitePart));
$ret=$iDb->select('infos_entrep', 'siren, nic, web, mail, tel, fax', "siren=$siren");
if ($ret[0]['siren']*1==0) {
$iDb->update('infos_entrep', array('web'=>$newWeb,'mail'=>$newMel), "siren=$siren");
echo 'maj ok';
} else
echo 'MAJ KO !!!';
echo EOL;
}
}
/*
if ($tabIdentite['Actif']==1) {
$tdeb=microtime(1);
$iTel=new MTel();
$tmp=$iTel->getTel($siren);
if (count($tmp)>0 && $nic*1>0) {
$tmp=$iTel->getTel($siren, $nic);
$sirenTrouve=true;
$siretTrouve++;
} else
$sirenTrouve=false;
if ($iTel->enCache)
$siretEnCache++;
$duree=round(microtime(1)-$tdeb,3);
$iDb->select('telephonie', 'dateProvPartenaire, typeTel, infoTel varchar(255) latin1_swedish_ci Non Affiche les valeurs distinctes Modifier Supprimer Primaire Unique Index Texte entier
telephone int(10) UNSIGNED ZEROFILL Non 0000000000 Affiche les valeurs distinctes Modifier Supprimer Primaire Unique Index Texte entier
actif tinyint(1) UNSIGNED Non Affiche les valeurs distinctes Modifier Supprimer Primaire Unique Index Texte entier
partenaire tinyint(1) UNSIGNED Non 0 Affiche les valeurs distinctes Modifier Supprimer Primaire Unique Index Texte entier
dateInsert
*/
}
//die();
}
}
die();
function traiteStr($str) {
if ($str=='http://') return '';
return trim(strtr($str, array('&nbsp;'=>'', '%40'=>'@', '%22%22%20%3C'=>'', '%3E?subject=bonjour%20'=>'', )));
//
}
?>