#!/usr/bin/php -c/var/www/batch/config/php_batch_sd.ini
select('tabPays', 'codPays, codPays3, libPays', "1 /*codPays='DE'*/", false, MYSQL_ASSOC);
$nbTrt=count($tabPays);
foreach ($tabPays as $iTrt=>$pays) {
$pays2=$pays['codPays'];
$pays3=$pays['codPays3'];
$paysLib=$pays['libPays'];
echo date('Y/m/d H:i:s') . "$pays2\t$pays3\t$paysLib\t";
$url="http://www.info-clipper.com/index.php?country_code=$pays2&my_search=&my_adress=&my_postcode=&my_town=&q=SearchItems&my_duns=";
$page=getUrl($url);
if ($page['code']<>200) echo "KO\t";
else {
$lib=$cod='';
echo "ok\t";
$body=$page['body'];
if (preg_match("/
'))));
$tabRet['capitalDev']=trim(htm2txt(@getTextInHtml($body, 'Capital social (', ' (', '')));
$tabRet['capitalMt']=trim(htm2txt(@getTextInHtml($body, 'Capital social (', '', '')));
print_r($tabRet);
//print_r($page);
die();
/*11:26:17.340[239ms][total 816ms] État: 200[OK]
GET http://www.aef.cci.fr/accueil/listeEntreprises/ficheEntreprise?siret=51462335400016 Indicateurs chargement[LOAD_DOCUMENT_URI LOAD_INITIAL_DOCUMENT_URI ] Taille contenu[14043] Type Mime[text/html]
En-têtes requête:
Host[www.aef.cci.fr]
User-Agent[Mozilla/5.0 (Windows; U; Windows NT 5.1; fr; rv:1.9.1.3) Gecko/20090824 Firefox/3.5.3 (.NET CLR 3.5.30729) FirePHP/0.3]
Accept-Language[fr,fr-fr;q=0.8,en-us;q=0.5,en;q=0.3]
Accept-Encoding[gzip,deflate]
Accept-Charset[ISO-8859-1,utf-8;q=0.7,*;q=0.7]
Keep-Alive[300]
Connection[keep-alive]
Referer[http://www.aef.cci.fr/accueil/listeEntreprises]
Cookie[_ZopeId="37588307A4Cwlzf3Lu4"; SERVERID=zope5; __utma=67492737.1045109818.1252916446.1252916446.1252916446.1; __utmb=67492737.50.10.1252916446; __utmc=67492737; __utmz=67492737.1252916446.1.1.utmgclid=CKnsnYPW8JwCFZkA4wodMjdujQ|utmccn=(not%20set)|utmcmd=(not%20set)|utmctr=registre%20des%20metiers]
En-têtes réponse:
Date[Mon, 14 Sep 2009 09:28:45 GMT]
Server[Zope/(Zope 2.9.0-, python 2.4.3, linux2) ZServer/1.1]
Content-Length[14043]
Content-Type[text/html; charset=utf-8]
Cache-Control[no-cache]
Connection[close]
**/
function chechSirenSiteAfnic($siteWeb) {
$referer='http://www.afnic.fr/';
$url='http://www.afnic.fr/outils/whois/'.$siteWeb;
//die(print_r(parse_url('http://www.'.$siteWeb.'/')));
/*print_r(pathinfo('http://www.'.$siteWeb.'/index.html'));
print_r(pathinfo($siteWeb));
die();*/
$page=getUrl($url, '', '', $referer);
if ($page['code']==200) {
if(preg_match('/Identifié grâce au numéro de SIREN (.*)<\/a><\/li>/Uis', $page['body'], $matches))
echo html_entity_decode($matches[1]);
die();
}
}
chechSirenSiteAfnic('dipinfo.fr');
function findSiteWeb($siren)
{
$referer='http://www.google.fr/';
$siren2=implode(' ', str_split($siren, 3));
$rs="$siren OR \"$siren2\" -site:gouv.fr -site:info-financiere.fr -site:bodacc.fr -site:manageo.fr -site:bilansgratuits.fr -site:lesechos.fr -site:google.fr";
$url='http://www.google.fr/search?hl=fr&as_qdr=all&q='.urlencode($rs).'&btnG=Rechercher';//&meta=cr%3DcountryFR';
//http://www.google.fr/search?hl=fr&q=448364232+OR+%22448+364+232%22+-site%3Agouv.fr++-site%3Ainfo-financiere.fr+-site%3Abodacc.fr&btnG=Rechercher&meta=
$page=getUrl($url, '', '', $referer, false, 'www.google.fr','', 5);
//$fp=fopen('./findSiteWeb.log', 'a+');
if ($page['code']==200) {
$levMin=100;
$pctMin=0;
$urlLev=$urlPct='';
$body=$page['body'];
preg_match_all('/$url)
{
/* $lev=@levenshtein ($urlapprox,$url);
if ($lev>0 && $lev<$levMin) {
$levMin=$lev;
$urlLev=$url;
}
$sim=similar_text($urlapprox,$url,$pct);
if ($pct>$pctMin && strpos($url, 'zonebourse')===false) {
$pctMin=$pct;
$urlPct=$url;
}
fwrite($fp, date('Y-m-d H:i:s') .' - '. $page['code'] . " - $rs - $i - $lev (Min=$levMin) - $pct (Min=$pctMin) - $urlLev - $urlPct - $url\n");*/
if ($i>=10 && preg_match('/^http\:\/\//is', $url) && !preg_match('/google/is', $url))
echo "$i: $siren = $url".EOL; //2008-05-20 20:01:08 - 200- ARKEMA FRANCE - 53 - 20 - 10 - http://www.arkema.fr/ - http://www.zonebourse.com/ARKEMA-17031/ - /intl/fr/about.html
}
//fclose($fp);
/* if ($levMin<15 && $pctMin>44 && $urlLev==$urlPct) {
fwrite($fp, date('Y-m-d H:i:s') .' - '. $page['code'] . " - $rs - $i - $lev (Min=$levMin) - $pct (Min=$pctMin) - $urlLev - $urlPct - $url !!! RETURNED !!!\n");
return $urlLev;
}
return false;*/
}
//fclose($fp);
return false;
}
//die();
/*
print_r($iGreffe->getListeEtab(552144503));
//print_r($iGreffe->getIdentite(552144503));
die();
*/
//print_r($iGreffe->getIdentite('323972596'));
//print_r($iGreffe->getIdentite('552144503'));
?>