batch/1.1/old/testExtractMederic.php
2013-06-19 08:24:49 +00:00

763 lines
29 KiB
PHP

#!/usr/bin/php -c/var/www/batch/config/php_batch_sd.ini
<?php
function exporte($txt, $lon=false, $sep="\t") {
if ($lon===false) $lon=strlen($txt);
$txt=strtr(trim($txt),array('&#039;'=>"'",'&amp;'=>'&', '&sup2;'=>'²', "\r"=>'', "\n"=>'', "\t"=>''));
if ($sep=='') return sprintf("%-".$lon.'.'.$lon."s", $txt);
return trim(sprintf("%-".$lon.'.'.$lon."s", $txt)).$sep;
}
include_once(FWK_PATH.'common/chiffres.php');
include_once(FWK_PATH.'common/dates.php');
include_once(INCLUDE_PATH.'insee/classMInsee.php');
include_once(INCLUDE_PATH.'partenaires/classMGreffes.php');
include_once(INCLUDE_PATH.'partenaires/classMTel.php');
include_once(INCLUDE_PATH.'partenaires/classMMap.php');
include_once(INCLUDE_PATH.'partenaires/classMLiens.php');
include_once(INCLUDE_PATH.'tmp/configMRatios.php');
include_once(INCLUDE_PATH.'insee/classMSirene.php');
include_once(INCLUDE_PATH.'partenaires/classMBilans.php');
include_once(INCLUDE_PATH.'partenaires/classMBourse.php');
include_once(INCLUDE_PATH.'scores/classMFinancier.php');
include_once(INCLUDE_PATH.'scores/classMSolvabilite.php');
include_once(INCLUDE_PATH.'partenaires/classMTva.php');
include_once(INCLUDE_PATH.'scores/classMScores.php');
include_once(FWK_PATH.'mail/sendMail.php');
$iGreffe=new MGreffes();
$iInsee=new MInsee();
$iLiens=new MLiens(0);
/*
$tabSiren=array(310682596,
338843337,
342711967,
382107969,
394862080,
404566390,
418905550,
423463785,
440204352,
444028765,
485210603,
500844998,
512918079,
524655024,
532764180,
532786761,
532859261,
532878345,
532898582,
532899408,
532962560,
532965340,
532983301,
532993003,
532997103,
532998333,
533001079,
533015483,
533019279,
533029930,
533039889,
533097796,
533102554,
533112876,
533125423,
533141305,
533178430,
533198974,
533208070,
533210324,
533210324,
533220307,
533225728,
533253613,
533261798,
533264685,
533265781,
);
foreach ($tabSiren as $siren) {
$tabId=$iInsee->getIdentiteEntreprise($siren);
$dateImmat=WDate::dateT('Y-m-d','d/m/Y', $tabId['dateImmat']);
$dateCreaEt=WDate::dateT('Ymd','d/m/Y', $tabId['DateCreaEt']);
$dateCreaEn=WDate::dateT('Ymd','d/m/Y', $tabId['DateCreaEn']);
$tabEve=$iInsee->getEvenements($siren);
$eve=end($tabEve);
$dateCFE=WDate::dateT('Ymd','d/m/Y', substr($eve['dateMAJ'],0,8));
$dateSED=WDate::dateT('Ymd','d/m/Y', $eve['dateEven']);
echo "$siren,$dateCFE,$dateSED,$dateImmat,$dateCreaEt,$dateCreaEn".EOL;
}
die();*/
/*echo $iLiens->getMaisonMereFr(542051180).EOL;
echo $iLiens->getMaisonMereFr(552144503).EOL;
die();*/
//print_r($iLiens->getInfoGroupe(384705943));//479145393));//420495178));//403210032));//554501171));//542051180));//542034921));//
//print_r($iLiens->getInfoGroupe(378648992));
//die();
$tabSiren=array(378648992//433977980 //632012100,
//378648992,
);
//echo 'Siret;Siège;Raison Sociale;Raison Sociale (suite);Enseigne;N° et Nom de Rue;Complément adresse;CP;Ville;Code départ INSEE;Code Commune INSEE;Catégorie juridique;Libellé CJ;Code Naf;Libellé Naf;Latitude;Longitude;Précision;lambert X;lambert Y;Tranche effectif établissement;Tranche effectif entreprise;effectif bilan;date de création établissement;date de création entreprise;nb établissements actifs;Capital;Capital Devise;Ch Aff;tel;fax'.EOL;
//////$fp=fopen('./fichierMedericLien.csv','a');
//$fp=fopen('./actionnairesVeolia.csv','a');
$fp=fopen('./organigroupe.csv','a');
/*@fwrite($fp,"Siret\tActif\tRC\tIsin\tSiege\tNom\tNom2\tEnseigne\tAdresse\tAdresse2\tCP\tVille\tDept\tcodeCommune\tFJ\tFJ_lib\tNafEtab\tNafEtabLib\tEffEnTr\t");
@fwrite($fp,"bilanYP\tDateCreaEt\tDateCreaEn\tNbEtab\tCapital\tCapitalDev\tbilanDate\tbilanMois\tbilanDevise\tCONSOLIDE\tbilanDA\tbilanFL\tbilanHN\tbilanYP\t");
@fwrite($fp,"R[6]\tR[8]\tR[10]\tR[19]\tR[23]\tR[235]\tR[236]\tR[64]\tR[24]\tR[59]\tR[51]\tR[52]\tR[53]\tR[69]\tR[60]\tR[61]\tR[62]\tR[63]\tR[22]\t");
@fwrite($fp,"R[79]\tR[70]\tR[71]\tR[72]\tR[90]\tR[83]\tR[84]\tR[85]\tR[86]\tR[87]\tR[22]\t");
@fwrite($fp,"R[101]\tR[102]\tR[110]\tR[111]\tR[112]\tR[120]\tR[121]\tR[122]\tR[123]\tR[130]\tR[132]\tR[133]\t");
@fwrite($fp,"R[131]\tR[140]\tR[141]\tR[142]\tR[143]\tR[144]\tR[145]\tR[150]\tR[151]\tR[152]\tR[153]\tR[170]\t");
@fwrite($fp,"R[171]\tR[172]\t\tR[181]\tR[182]\tR[199]\t");
@fwrite($fp,"CS\tCT\tCU\tCV\tBB\tBC\tBZ\tDU\tDV\tGI\tIJ\tGR\tIK\tVC\tVI".EOL);
$tabSiren=array(494967938,
552144503);
*/
foreach ($tabSiren as $iS=>$siren) {
$j=$i+1;
if ($siren>0) {
$tabRet=array();
$tabRet2=$iLiens->getArboresence($siren, 25, 50, 1, array(), 0, 0, 0, true, 'txt', $tabRet);
print_r($tabRet);
print_r($tabRet2);
die();
/*
$tabId=$iInsee->getIdentiteEntreprise($siren);
$sirenMere=$iLiens->getMaisonMereFr($siren);
$tabId2=$iInsee->getIdentiteEntreprise($sirenMere);
echo "Z, $siren, ".$tabId['Nom'].", $sirenMere,".$tabId2['Nom'].EOL;
$tabSirenAll=array();
$tabSirenAll=$iLiens->getAllParticipations($sirenMere, 50, 50, 1, $tabSirenAll, $siren, $sirenMere, 0, true, 'txt');/*
ublic function getAllParticipations($siren, $pctMin=33, $nbNiveaux=15, $niveauCour=1, $tabSiren=array(), $sirenIni=0, $sirenMere=0, $appel=0, $actifsUniquement=true, $format='txt') {
$tabPct=$iLiens->getParticipations($siren, true);
foreach ($tabPct as $i=>$lien) {
$sirenPct=$lien['Siren'];
if($sirenPct>100 && ($lien['PminNum']>32 || $lien['MajMin']=='+')) {
$tabIdentiteP=$iInsee->getIdentiteLight($sirenPct);
$groupePct=$lien['PminNum'];
$groupeVF='Vrai';
break;
}
}*/
/*foreach($tabSirenAll as $siren) {
$tabScore=@calculIndiScore($siren, 0, false, 0);
echo "$siren,".$tabScore['Indiscore'].EOL;
}*/
}
}
/*foreach($tabSirenAll as $siren) {
$tabScore=@calculIndiScore($siren, 0, false, 0);
print_r($tabScore);die();
}*/
die();
/*
// print_r($tabId);
$tabAct=$iLiens->getActionnaires($siren, true);
$groupePct='';
$groupeVF='Faux';
foreach ($tabAct as $i=>$lien) {
$sirenAct=$lien['Siren'];
$tabIdentiteA=$iInsee->getIdentiteLight($sirenAct);
if($sirenAct>100 && ($lien['PminNum']>32 || $lien['MajMin']=='+')) {
$groupePct=$lien['PminNum'];
$groupeVF='Vrai';
break;
}
}
echo "!!!!!!!!!!!!!!!!!!!!!!!!!!!!! siren n°$iS : $siren !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!".EOL;
if ($groupeVF=='Vrai') {
$sirenMere=$iLiens->getMaisonMereFr($siren);
echo "Siren Mère = $sirenMere".EOL;
$tabIdMere=$iInsee->getIdentiteEntreprise($sirenMere);
echo "Après getIdMere".EOL;
$tabSiren=$iLiens->getAllParticipations($sirenMere);
$groupeNbEntrep=count($tabSiren);
$groupeEffectif=$groupeNbEtab=0;
$groupeEffectifAn=2007;
foreach($tabSiren as $sirenGrp) {
$tabId2=$iInsee->getIdentiteEntreprise($sirenGrp);
$groupeEffectif+=$tabId2['Effectif'];
$groupeNbEtab+=$tabId2['NbEtab'];
if ($tabId2['AnneeEffEn']>$groupeEffectifAn) $groupeEffectifAn=$tabId2['AnneeEffEn'];
// if ($tabId2['AnneeEffEt']>$groupeEffectifAn) $groupeEffectifAn=2007;
}*/
//}
/*
$strOut =exporte($tabId['Source'].'-'.$tabId['SourceId']); // N° identifiant entreprise chez le fournisseur
$strOut.=exporte($tabId['Siren']); // Siren
$strOut.=exporte($tabId['SiretSiege']); // Siret
$strOut.=exporte($tabId['Nom']); // Nom ou raison sociale (1ère partie)
/*$strOut.=exporte($tabId['Nom2']); // Nom ou raison sociale (2ème partie)
$strOut.=exporte($tabId['Enseigne']); // Enseigne
$strOut.=exporte($tabId['Sigle']); // Sigle
$strOut.=exporte($tabId['Adresse']); // Adresse
$strOut.=exporte($tabId['Adresse2']); // Boite Postale
$strOut.=exporte($tabId['CP']); // Code Postale
$strOut.=exporte($tabId['Ville']); // Ville
$dep=$tabId['Dept'];
if ($tabId['Dept']==97 || $tabId['Dept']==98) $dep=''.$tabId['Dept'].''.substr($tabId['codeCommune'],0,1);
$tabId2=$iInsee->getInfosNotice($tabId['Siren'], $tabId['Nic']);
$strOut.=exporte($tabId2['insRPET']); // Région
$strOut.=exporte($dep); // Département
$strOut.=exporte($tabId2['insARRONET']); // Arrondissement INSEE
$strOut.=exporte($tabId2['insCTONET']); // Canton INSEE
$strOut.=exporte($tabId['Dept'].$tabId['codeCommune']); // Commune INSEE
$strOut.=exporte($tabId['insTCD']); // Taille de la commune (par tranche)
$strOut.=exporte($tabId['Tel']); // Téléphone standard
$strOut.=exporte($tabId['Fax']); // Fax standard
$strOut.=exporte($tabId['NafEtab']); // NAF5 établissement
$strOut.=exporte($tabId['NafEtabLib']); // NAF5 établissement libellé
$strOut.=exporte($tabId['Activite']); // Activité principale déclarée
$strOut.=exporte($tabId['FJ']); // Catégorie - Forme juridique
$strOut.=exporte($tabId['FJ_lib']); // Catégorie - Forme juridique libellé
$strOut.=exporte($tabId['EffectifEtab']); // Effectif établissement (effectif à l'adresse)
$strOut.=exporte($groupeEffectif); // Effectif groupe (effectifs consolidés de tous les siren rattachés à ce groupe. Si l'entreprise n'est pas rattachée à un groupe, alors nous aurons ici le même chiffre que dans le champs effectif établissement)
$strOut.=exporte($tabId['AnneeEffEt']); // Date mise à jour de l'effectif salarié de l'établissement
$strOut.=exporte($groupeEffectifAn); // date mise à jour de l'effectif salarié Groupe
$strOut.=exporte($tabId['OrigineCreation']); // Origine de la création
$strOut.=exporte($tabId['DateCreaEt']); // Date de création de l'établissement
$strOut.=exporte($tabId['TrancheCA']); // Tranche de chiffre d'affaires
$strOut.=exporte($groupeVF); // Appartient à un groupe (Vrai / Faux)
$strOut.=exporte($tabIdMere['Nom']); // Nom du Groupe
$strOut.=exporte($tabId['Siege']); // Qualité de siège (Vrai / Faux)
$strOut.=exporte($groupeNbEtab); // Nombre d'établissement dans le groupe
$strOut.=exporte($tabIdMere['Siret']); // Siret Actionnaire majoritaire
$strOut.=exporte($tabIdMere['Siren']); // Siren Actionnaire majoritaire
$strOut.=exporte($groupePct); // Pourcentage de détention
$strOut.=exporte($tabIdMere['DateCreaEn']); // Date de création du groupe
$strOut.=exporte($tabIdMere['NafEn']); // NAF5 Groupe
$strOut.=exporte($tabId['insRPEN']); // Région d'implantation du siège
$strOut.=exporte($tabId['insDEPCOMEN']); // Département commune du siège
$ann=$iInsee->getAnnoncesLegales($tabId['Siren']);
if ($ann[0]['dateJugement']<>'0000-00-00') $dateAnn=$ann[0]['dateJugement'];
else $dateAnn=$ann[0]['DateParution'];
$strOut.=exporte($ann[0]['evenements'][0]['CodeEven']); // Code détection d'événement
$strOut.=exporte($dateAnn); // Date annonce
$strOut.=exporte($tabId['bilanDate']); // Date du bilan
$strOut.=exporte($tabId['bilanFL']); // Chiffre d'affaires en euro
$strOut.=exporte($tabId['bilanHN']); // Résultat en euro
*/
/*
$R=array();
$Rp=array();
$mBil=new MBilans($siren);
echo '================= PLANTE AVANT ==================='.EOL;
$tabBilans=$mBil->listeBilans(true);
echo '================= PLANTE APRES ==================='.EOL;
$NBBILAN=count($tabBilans);
$tabBilan=$tabBil=array();
if ($NBBILAN>0)
$tabRatios=calculRatios($tabBilans, $tabId, false);
echo '================= PLANTE APRES v2 ==================='.EOL;
$R=$tabRatios[0];
$Rp=$tabRatios[1];
//$bilan=$tabBilan[0];
$strOut =exporte($siren);
$strOut.=exporte($R[2]); // Valeur ajoutée
$strOut.=exporte($Rp[2]); // Valeur ajoutée
/*$strOut.=exporte($tabId['SiretSiege']); // Excédent brut d'exploitation en %
$strOut.=exporte($R[140]); // Excédent brut d'exploitation en valeur
$strOut.=exporte($R[170]); // Résultat courant avant impôts
$strOut.=exporte($R[199]); // Résultat Net
$strOut.=exporte($R[233]); // Capacité d'autofinancement
$strOut.=exporte($R[132]); // Frais de personnel
$strOut.=exporte($R[153]); // Frais financiers
$strOut.=exporte($R[536]); // A vérifier // Croissance du CA
$strOut.=exporte($R[262]); // Rentabilité économique
$strOut.=exporte($R[263]); // Rentabilité financière
$strOut.=exporte($R[503]); // MBA en % du CA
$strOut.=exporte($R[263]); // RN / Capitaux
$strOut.=exporte($bilan['EC']/$R[70]); // Dettes / capitaux
$strOut.=exporte($bilan['EE']/$bilan['EC']); // Actif / Dettes
*/
echo '================= PLANTE APRES v3 ==================='.EOL;
/*
$strOut.=exporte($tabId['Web']); // Site WEB
$strOut.=exporte($tabId['NafEnt']); // NAF5 entreprise
$strOut.=exporte($tabId['NafEntLib']); // NAF5 entreprise libellé
$strOut.=exporte($tabId['Effectif']); // Effectif entreprise (toutes les adresses ou tous les établissements)
$strOut.=exporte($tabId['AnneeEffEn']); // Date mise à jour de l'effectif salarié de l'entreprise
$strOut.=exporte($tabId['DateCreaEn']); // Date de création de l'entreprise
$strOut.=exporte($tabId['NbEtab']); // Nombre d'établissement de l'entreprise
$tabDir=array_merge($iInsee->getDirigeants($tabId['Siren'], false),$iInsee->getDirigeantsOp($tabId['Siren']));
echo '================= PLANTE APRES v4 ==================='.EOL;
$j=0;
foreach ($tabDir as $i=>$dir) {
if ($dir['Fonction']*1<100) {
$j++;
$strOut.=exporte($dir['Civilite']); // Civilité 1
$strOut.=exporte($dir['Prenom']); // Prénom 1
$strOut.=exporte($dir['Nom']); // Nom 1
$strOut.=exporte($dir['Titre']); // Fonction 1
$strOut.=''; // Age du Dirigeant
$locMail='Oui';
$strOut.=exporte($locMail); // Possibilité location d'adresse mail pour cet interlocuteur (Oui / Non)
} else {
switch($dir['Fonction']*1) {
case 400: // Co-gérant
case 603: // Contrôleur de gestion
case 704: // Directeur général délégué
case 709: // Directeur général
case 713: // Directeur général non administrateur
case 900: // Gérant
case 912: // Gérant non associé
case 1300: // Président
case 1301: // Président directeur général
case 1306: // Président du conseil d'administration
case 1307: // Président du conseil de surveillance
case 1308: // Président du directoire
case 1401: // Représentant de société étrangère
case 1800: // Vice-président
case 1900: // Liquidateur
$j++;
$strOut.=exporte($dir['Civilite']); // Civilité 1
$strOut.=exporte($dir['Prenom']); // Prénom 1
$strOut.=exporte($dir['Nom']); // Nom 1
$strOut.=exporte($dir['Titre']); // Fonction 1
$strOut.=exporte(2010-substr($dir['NaissDate'],-4)); // Age du Dirigeant
$locMail='Non';
if ($j==1 && $tabId['Mail']<>'') $locMail='Oui';
$strOut.=exporte($locMail); // Possibilité location d'adresse mail pour cet interlocuteur (Oui / Non)
break;
}
}
if ($j==3) break;
}
echo '================= PLANTE APRES v5 ==================='.EOL;
*/
echo $strOut.EOL;
fwrite($fp,$strOut.EOL);
echo '================= PLANTE APRES v6 ==================='.EOL;
//die();
// print_r($tabIdentite);
//print_r($bilan);
//die();
/* @fwrite($fp, $tabId['Siret'] ."\t".
$tabId['Actif'] ."\t".
$tabId['AutreId'] ."\t".
$tabId['Isin'] ."\t".
$tabId['Siege'] ."\t".
$tabId['Nom'] ."\t".
$tabId['Nom2'] ."\t".
$tabId['Enseigne'] ."\t".
$tabId['Adresse'] ."\t".
$tabId['Adresse2'] ."\t".
$tabId['CP'] ."\t".
$tabId['Ville'] ."\t".
$tabId['Dept'] ."\t".
$tabId['codeCommune'] ."\t".
$tabId['FJ'] ."\t".
$tabId['FJ_lib'] ."\t".
$tabId['NafEtab'] ."\t".
$tabId['NafEtabLib'] ."\t".
$tabId['EffEnTr'] ."\t".
$tabId['bilanYP'] ."\t".
$tabId['DateCreaEt'] ."\t".
$tabId['DateCreaEn'] ."\t".
$tabId['NbEtab'] ."\t".
$tabId['Capital'] ."\t".
$tabId['CapitalDev'] ."\t".
."\t".
$tabId['bilanMois'] ."\t".
$tabId['bilanDevise'] ."\t".
$bilan['CONSOLIDE'] ."\t".
$tabId['bilanDA'] ."\t".
$tabId['bilanFL'] ."\t".
$tabId['bilanHN'] ."\t".
$tabId['bilanYP'] ."\t".
/* $tabId['bilanPQ'] ."\t".
$tabId['bilanPU'] ."\t".
$tabId['bilanPY'] ."\t".
$tabId['bilanQC'] ."\t".*
// Synthèse
$R[6] ."\t".
$R[8] ."\t".
$R[10] ."\t".
$R[19] ."\t".
$R[23] ."\t".
$R[235] ."\t".
$R[236] ."\t".
$R[64] ."\t".
$R[24] ."\t".
// Actif simplifié
$R[59] ."\t".
$R[51] ."\t".
$R[52] ."\t".
$R[53] ."\t".
$R[69] ."\t".
$R[60] ."\t".
$R[61] ."\t".
$R[62] ."\t".
$R[63] ."\t".
$R[22] ."\t".
// Passif simplifié
$R[79] ."\t".
$R[70] ."\t".
$R[71] ."\t".
$R[72] ."\t".
$R[90] ."\t".
$R[83] ."\t".
$R[84] ."\t".
$R[85] ."\t".
$R[86] ."\t".
$R[87] ."\t".
$R[22] ."\t".
// SIG
$R[101] ."\t".
$R[102] ."\t".
$R[110] ."\t".
$R[111] ."\t".
$R[112] ."\t".
$R[120] ."\t".
$R[121] ."\t".
$R[122] ."\t".
$R[123] ."\t".
$R[130] ."\t".
$R[132] ."\t".
$R[133] ."\t".
$R[131] ."\t".
$R[140] ."\t".
$R[141] ."\t".
$R[142] ."\t".
$R[143] ."\t".
$R[144] ."\t".
$R[145] ."\t".
$R[150] ."\t".
$R[151] ."\t".
$R[152] ."\t".
$R[153] ."\t".
$R[170] ."\t".
$R[171] ."\t".
$R[172] ."\t".
$R[181] ."\t".
$R[182] ."\t".
$R[199] ."\t".
// Postes Précis
$bilan['CS'] ."\t".
$bilan['CT'] ."\t".
$bilan['CU'] ."\t".
$bilan['CV'] ."\t".
$bilan['BB'] ."\t".
$bilan['BC'] ."\t".
$bilan['BZ'] ."\t".
$bilan['DU'] ."\t".
$bilan['DV'] ."\t".
$bilan['GI'] ."\t".
$bilan['IJ'] ."\t".
$bilan['GR'] ."\t".
$bilan['IK'] ."\t".
$bilan['VC'] ."\t".
$bilan['VI'] .EOL);
echo "$i/$nb:".$tabId['Siret']."\t".$tabId['Nom']."\t".$tabId['CP']."\t".$tabId['Ville'].EOL;
//randsleep(7,21);
//die()*/
/*
}
}
fclose($fp);*/
die();
shuffle($tabSiren);
foreach ($tabSiren as $i=>$siren) {
$strValide='invalide !';
if ($iInsee->valideSiren($siren)) {
$strValide='VALIDE...';
print_r($iGreffe->getIdentite($siren));
randsleep(7,21);
}
echo "$i: $siren $strValide".EOL;
//findSiteWeb($siren);
//die();
}
die();
/*
$tabAdresses=file('./adresse.txt');
$fp=fopen('./adresses.csv', 'w');
foreach ($tabAdresses as $ligne) {
$adr=$iInsee->structureVoie($ligne);
$adrComp=@trim($adr['adrComp0'].' '.$adr['adrComp1'].' '.$adr['adrComp2']);
@fwrite($fp, ''. $adr['num'] .';'. $adr['indRep'] .';'. $adr['typeVoie'] .';'. $adr['libVoie'] .';'. $adr['cp'] .';'. $adr['ville'] .';'. $adrComp . EOL);
// fgets(STDIN);
}
fclose($fp);*/
$strNafCpf=utf8_decode(file_get_contents('/root/NAFrev2CPF2008.txt'));
preg_match_all('/([0-9]{2,2}\.[0-9]{2,2}[A-Z]{1,1})(?:.*)(Cette sous-classe comprend \:.*)(Produits associés \:.*\n\n)/Uis',$strNafCpf,$matches);
//(.*)
$tabNaf=$matches[1];
$tabTxt=$matches[2];
$tabCpf=$matches[3];
//print_r($matches[4]);
foreach ($tabNaf as $i=>$naf) {
$strCpf=trim(preg_replace('/ +/',' ', strtr(strtoupper(strtr($tabCpf[$i], array('Produits associés :'=>'', "\r"=>' ',"\n"=>' '))),'ABCDEFGHIJKLMNOPQRSTUVWXYZ.ÉÈ-',' ')));
$tabCpf2=explode(',', $strCpf);
$tabCpf3=array();
foreach ($tabCpf2 as $cpf)
$tabCpf3[]=strtr($cpf,array(' '=>''));
echo "$i:".$tabNaf[$i]."\t".implode(',',$tabCpf3).EOL;
}
die();
/*36.00Z Captage, traitement et distribution d'eau
Cette sous-classe comprend aussi :
- l'exploitation de canaux d'irrigation
- l'exploitation d'appareils d'irrigation à des fins agricoles (cf. 01.61Z)
- le traitement des eaux usées à des fins de prévention de la pollution (cf. 37.00Z)
- le transport (sur de longues distances) d'eau par conduite (cf. 49.50Z)
Cette sous-classe comprend :
- le captage d'eau à partir de rivières, de lacs et de puits, etc.
- la collecte d'eau de pluie
- le traitement de l'eau aux fins de la distribution d'eau
- le traitement de l'eau pour des usages industriels ou autres
- le dessalement de l'eau de mer ou d'eaux souterraines, pour autant que la production d'eau
constitue l'activité principale
- la distribution de l'eau par conduites, camions ou autres moyens de transport
36.00.11, 36.00.12, 36.00.20, 36.00.30*/
$siret='51462335400016';
$siret='55214450300018';
$siret='51462323000018'; // Aucun siret sur CCI
$siret='064410863';
$siret='56850374200013'; // Alsaceeco
$siret='49496793800031';
$siret='49205135400024';
$siret='91732031900010';
$url='http://www.aef.cci.fr/accueil';
$page=getUrl($url);
if ($page['code']<>200) die('A Erreur HTTP '.$page['code']." sur $url");
$cookies=$page['header']['Set-Cookie'];
$referer=$url;
$url='http://www.aef.cci.fr/accueil/accueil/validerFormulaire';
$post=array('label'=>'',
'identifiant'=>$siret,
'nom'=>'',
'dep'=>'',
);
usleep(rand(300,1000));
$page=getUrl($url, $cookies, $post, $referer);
$referer=$url;
//$cookies=$page['header']['Set-Cookie'];
if ($page['code']<>302) die('B Erreur HTTP '.$page['code']." sur $url");
$url=$page['header']['Location'];
$page=getUrl($url, $cookies, '', $referer);
$referer=trim($url);
//$pageJS=getUrl('http://www.aef.cci.fr/scripts/Marqueur.js', $cookies, '', $referer);
//die(print_r($pageJS));
if (!preg_match_all('/<strong><a href="ficheEntreprise\?siret=(.*)">(.*)<\/a>(?:.*)<\/strong>/Uis', $page['body'], $matches))
die("C Erreur : Aucun siret $siret sur $url");
else {
if (strlen($siren)<14 && count($matches[1])==1)
$siret=$matches[1][0];
else {
echo "$siret $url $cookies : Choisir le bon nic !".EOL;
print_r($matches);
die();
}
}
// http://www.aef.cci.fr/accueil/listeEntreprises/ficheEntreprise?siret=
$url='http://www.aef.cci.fr/accueil/listeEntreprises/ficheEntreprise?siret='.$siret;
usleep(rand(200,900));
$strCookies=str_replace("Path=/\r\n",'', $cookies);
echo "$siret $url ($referer) $strCookies $cookies".EOL;
$page=getUrl($url, $strCookies, '', $referer);
$body=$page['body'];
$tabRet=array();
$lienCCI=trim(htm2txt(@getTextInHtml($body, '<p class="ficheCCI">', 'href', '</p>')));
$tmp=explode('"', $lienCCI);
$tabRet['nomCCI']=str_replace('>','', end($tmp));
$tabRet['urlCCI']=$tmp[1];
$tabRet['siret']=trim(htm2txt(@getTextInHtml($body, '<dt>SIRET</dt>', '<dd>', '</dd>')));
$tabRet['enseigne']=utf8_decode(trim(htm2txt(@getTextInHtml($body, '<dt>Enseigne</dt>', '<dd>', '</dd>'))));
$tabRet['statut']=utf8_decode(trim(htm2txt(@getTextInHtml($body, '<dt>Statut</dt>', '<dd>', '</dd>'))));
$tabRet['categorie']=utf8_decode(trim(htm2txt(@getTextInHtml($body, '<dt>Catégorie</dt>', '<dd>', '</dd>'))));
$tabRet['voie']=utf8_decode(trim(htm2txt(@getTextInHtml($body, '<dt>Voie </dt>', '<dd>', '</dd>'))));
$tabRet['bp']=trim(htm2txt(@getTextInHtml($body, ' <dt>Boite postale </dt>', '<dd>', '</dd>')));
$tabRet['cp']=trim(htm2txt(@getTextInHtml($body, '<dt>Code postal </dt>', '<dd>', '</dd>')));
$tabRet['ville']=utf8_decode(trim(htm2txt(@getTextInHtml($body, '<dt>Ville</dt>', '<dd>', '</dd>'))));
$tabRet['pays']=trim(htm2txt(@getTextInHtml($body, '<dt>Pays </dt>', '<dd>', '</dd>')));
$tabRet['tel']=trim(htm2txt(@getTextInHtml($body, '<dt>Téléphone </dt>', '<dd>', '</dd>')));
$tabRet['fax']=trim(htm2txt(@getTextInHtml($body, '<dt>Télécopie </dt>', '<dd>', '</dd>')));
$tabRet['web']=trim(htm2txt(@getTextInHtml($body, 'Site internet', 'href', '</dd>')));
$tabRet['dateDebut']=trim(htm2txt(@getTextInHtml($body, 'Date de début d\'activité', '<dd>', '</dd>')));
$tabRet['naf']=trim(htm2txt(@getTextInHtml($body, '<dt>Code NAF 2008', '<dd>', '</dd>')));
$tabRet['activite']=utf8_decode(trim(htm2txt(@getTextInHtml($body, 'Activité en clair', '<dd>', '</dd>'))));
$tabRet['siren']=trim(htm2txt(@getTextInHtml($body, '<dt>SIREN</dt>', '<dd>', '</dd>')));
$tabRet['rs']=utf8_decode(trim(htm2txt(@getTextInHtml($body, ' <dt>Raison sociale</dt>', '<dd>', '</dd>'))));
$tabRet['denom']=utf8_decode(trim(htm2txt(@getTextInHtml($body, '<dt>Dénomination </dt>', '<dd>', '</dd>'))));
$tabRet['fj']=utf8_decode(trim(htm2txt(@getTextInHtml($body, 'Forme juridique', '<dd>', '</dd>'))));
//$tabRet['lien']=$lienCCI;
$tabRet['diropp']=utf8_decode(trim(htm2txt(@getTextInHtml($body, 'quipe dirigeante</h3>', '<dl class="fiche">', '</div>'))));
$tabRet['dirleg']=utf8_decode(trim(htm2txt(@getTextInHtml($body, '<h4>Dirigeants</h4>', '<dl class="fiche">', '</div>'))));
$tabRet['capitalDev']=trim(htm2txt(@getTextInHtml($body, 'Capital social (', ' (', '</dt>')));
$tabRet['capitalMt']=trim(htm2txt(@getTextInHtml($body, 'Capital social (', '<dd>', '</dd>')));
print_r($tabRet);
//print_r($page);
die();
/*11:26:17.340[239ms][total 816ms] État: 200[OK]
GET http://www.aef.cci.fr/accueil/listeEntreprises/ficheEntreprise?siret=51462335400016 Indicateurs chargement[LOAD_DOCUMENT_URI LOAD_INITIAL_DOCUMENT_URI ] Taille contenu[14043] Type Mime[text/html]
En-têtes requête:
Host[www.aef.cci.fr]
User-Agent[Mozilla/5.0 (Windows; U; Windows NT 5.1; fr; rv:1.9.1.3) Gecko/20090824 Firefox/3.5.3 (.NET CLR 3.5.30729) FirePHP/0.3]
Accept-Language[fr,fr-fr;q=0.8,en-us;q=0.5,en;q=0.3]
Accept-Encoding[gzip,deflate]
Accept-Charset[ISO-8859-1,utf-8;q=0.7,*;q=0.7]
Keep-Alive[300]
Connection[keep-alive]
Referer[http://www.aef.cci.fr/accueil/listeEntreprises]
Cookie[_ZopeId="37588307A4Cwlzf3Lu4"; SERVERID=zope5; __utma=67492737.1045109818.1252916446.1252916446.1252916446.1; __utmb=67492737.50.10.1252916446; __utmc=67492737; __utmz=67492737.1252916446.1.1.utmgclid=CKnsnYPW8JwCFZkA4wodMjdujQ|utmccn=(not%20set)|utmcmd=(not%20set)|utmctr=registre%20des%20metiers]
En-têtes réponse:
Date[Mon, 14 Sep 2009 09:28:45 GMT]
Server[Zope/(Zope 2.9.0-, python 2.4.3, linux2) ZServer/1.1]
Content-Length[14043]
Content-Type[text/html; charset=utf-8]
Cache-Control[no-cache]
Connection[close]
**/
function chechSirenSiteAfnic($siteWeb) {
$referer='http://www.afnic.fr/';
$url='http://www.afnic.fr/outils/whois/'.$siteWeb;
//die(print_r(parse_url('http://www.'.$siteWeb.'/')));
/*print_r(pathinfo('http://www.'.$siteWeb.'/index.html'));
print_r(pathinfo($siteWeb));
die();*/
$page=getUrl($url, '', '', $referer);
if ($page['code']==200) {
if(preg_match('/<li>Identifié grâce au numéro de SIREN <a href="(?:.*) target="_blank" class="ext">(.*)<\/a><\/li>/Uis', $page['body'], $matches))
echo html_entity_decode($matches[1]);
die();
}
}
chechSirenSiteAfnic('dipinfo.fr');
function findSiteWeb($siren)
{
$referer='http://www.google.fr/';
$siren2=implode(' ', str_split($siren, 3));
$rs="$siren OR \"$siren2\" -site:gouv.fr -site:info-financiere.fr -site:bodacc.fr -site:manageo.fr -site:bilansgratuits.fr -site:lesechos.fr -site:google.fr";
$url='http://www.google.fr/search?hl=fr&as_qdr=all&q='.urlencode($rs).'&btnG=Rechercher';//&meta=cr%3DcountryFR';
//http://www.google.fr/search?hl=fr&q=448364232+OR+%22448+364+232%22+-site%3Agouv.fr++-site%3Ainfo-financiere.fr+-site%3Abodacc.fr&btnG=Rechercher&meta=
$page=getUrl($url, '', '', $referer, false, 'www.google.fr','', 5);
//$fp=fopen('./findSiteWeb.log', 'a+');
if ($page['code']==200) {
$levMin=100;
$pctMin=0;
$urlLev=$urlPct='';
$body=$page['body'];
preg_match_all('/<a href="(.*)"/iU', $body, $matches);
$urlapprox="http://$rs.";
foreach ($matches[1] as $i=>$url)
{
/* $lev=@levenshtein ($urlapprox,$url);
if ($lev>0 && $lev<$levMin) {
$levMin=$lev;
$urlLev=$url;
}
$sim=similar_text($urlapprox,$url,$pct);
if ($pct>$pctMin && strpos($url, 'zonebourse')===false) {
$pctMin=$pct;
$urlPct=$url;
}
fwrite($fp, date('Y-m-d H:i:s') .' - '. $page['code'] . " - $rs - $i - $lev (Min=$levMin) - $pct (Min=$pctMin) - $urlLev - $urlPct - $url\n");*/
if ($i>=10 && preg_match('/^http\:\/\//is', $url) && !preg_match('/google/is', $url))
echo "$i: $siren = $url".EOL; //2008-05-20 20:01:08 - 200- ARKEMA FRANCE - 53 - 20 - 10 - http://www.arkema.fr/ - http://www.zonebourse.com/ARKEMA-17031/ - /intl/fr/about.html
}
//fclose($fp);
/* if ($levMin<15 && $pctMin>44 && $urlLev==$urlPct) {
fwrite($fp, date('Y-m-d H:i:s') .' - '. $page['code'] . " - $rs - $i - $lev (Min=$levMin) - $pct (Min=$pctMin) - $urlLev - $urlPct - $url !!! RETURNED !!!\n");
return $urlLev;
}
return false;*/
}
//fclose($fp);
return false;
}
//die();
/*
print_r($iGreffe->getListeEtab(552144503));
//print_r($iGreffe->getIdentite(552144503));
die();
*/
//print_r($iGreffe->getIdentite('323972596'));
//print_r($iGreffe->getIdentite('552144503'));
?>