From 418c1a558030e82ad9e9a92342e03866df1d43c8 Mon Sep 17 00:00:00 2001 From: Michael RICOIS Date: Mon, 17 Jun 2013 18:19:56 +0000 Subject: [PATCH] Update getAsso --- 1.1/getAsso.php | 59 +++++++++++++++++++++++++++++-------------------- 1 file changed, 35 insertions(+), 24 deletions(-) diff --git a/1.1/getAsso.php b/1.1/getAsso.php index d4488b1c..9442f44d 100644 --- a/1.1/getAsso.php +++ b/1.1/getAsso.php @@ -8,7 +8,7 @@ include_once(FWK_PATH.'common/chiffres.php'); include_once(FWK_PATH.'common/dates.php'); include_once(INCLUDE_PATH.'bodacc/classMBodacc.php'); include_once(INCLUDE_PATH.'insee/classMInsee.php'); -include_once(FWK_PATH.'mail/sendMail.php'); +require_once 'framework/mail/sendMail.php'; $tabInfosGlobal=array(); $repPdfAssoCpt='/home/data/datafile/associations/bilans/'; @@ -18,7 +18,6 @@ function getNextDate($dateCour, $nbJours=7) { return $nextDate; } - global $tabDep; $tabDep = array( 'Dordogne'=>'24', @@ -144,9 +143,20 @@ function getInfosAnnonceAsso($annonceHtml, $depotComptes=false) $tabAnn['Annonce_Html']='#####'.str_replace(chr(160), ' ', html_entity_decode($annonceHtml)); if ($depotComptes) { + + $tabAnn['pdfLink']=@getTextInHtml($annonceHtml, ''); + $tmp=@getTextInHtml($annonceHtml, 'Date de clôture de l\'exercice : ', '', ''); $tabAnn['dateCloture']=WDate::dateT('d/m/Y', 'Y-m-d', $tmp); - $tabAnn['pdfLink']=@getTextInHtml($annonceHtml, ''); + if ( $tabAnn['dateCloture']=='' ) { + preg_match('/_([0-9]{8})/', $tabAnn['pdfLink'], $matches); + /*sendMail( + 'mricois@scores-decisions.com', + 'mricois@scores-decisions.com', + 'Associations', + $annonceHtml."\n\n\n".print_r($matches,1));*/ + } + $tabAnn['typeCompte']=@getTextInHtml($annonceHtml, '>', ''); $tabAnn['dateInsert']=date('YmdHis'); } else { @@ -191,14 +201,14 @@ function getInfosAnnonceAsso($annonceHtml, $depotComptes=false) $tabAnn['Assoc_Dotation']=trim(htm2txt(@getTextInHtml($tabAnn['Annonce_Html'], 'Montant de la dotation initiale :', 'initiale :', '.
'))); $tabAnn['Assoc_ProgAction']=trim(htm2txt(@getTextInHtml($tabAnn['Annonce_Html'], 'action pluriannuel :', 'pluriannuel :', '.
'))); $tabAnn['Assoc_Fondateurs']=trim(htm2txt(@getTextInHtml($tabAnn['Annonce_Html'], ' de chacun des fondateurs :', 'fondateurs :', '.

'))); - - + + //

Autorisation administrative.

//Date de signature de statuts : 21 décembre 1992.
//Date de la modification des statuts : 7 février 1996, autorisation délivrée par le préfet 16 mars 1996.

Autorisation tacite.

//Date de la demande de modification des statuts : 7 février 1996, sollicitée auprès du préfet de Paris.

- - + + $tabAnn['Assoc_Web']=@getTextInHtml($tabAnn['Annonce_Html'], 'ite Internet : ', '', ''); if (substr($tabAnn['Assoc_Web'],-1)=='.') $tabAnn['Assoc_Web']=substr($tabAnn['Assoc_Web'],0,-1); @@ -210,7 +220,7 @@ function getInfosAnnonceAsso($annonceHtml, $depotComptes=false) $tabAnn['Assoc_Objet']=htm2txt(@getTextInHtml($tabAnn['Annonce_Html'], '>Objet : ', '', '')); if(trim($tabAnn['Assoc_Objet'])=='') $tabAnn['Assoc_Objet']=htm2txt(@getTextInHtml($tabAnn['Annonce_Html'], 'Objet : ', '', '
')); - + $tabAnn['Assoc_NObjet']=htm2txt(@getTextInHtml($tabAnn['Annonce_Html'], 'Nouvel objet : ', '', '')); $tabAnn['Assoc_AObjet']=htm2txt(@getTextInHtml($tabAnn['Annonce_Html'], 'Additif à l’objet : ', '', '')); $tabAnn['Assoc_NAdresse']=htm2txt(@getTextInHtml($tabAnn['Annonce_Html'], 'Transféré ; nouvelle adresse : ', '', '. ')); @@ -221,7 +231,7 @@ function getInfosAnnonceAsso($annonceHtml, $depotComptes=false) $tabAnn['Assoc_Adresse']=htm2txt(@getTextInHtml($tabAnn['Annonce_Html'], 'Siège : ', '', '.
')); if (trim($tabAnn['Assoc_Adresse'])=='') $tabAnn['Assoc_Adresse']=htm2txt(@getTextInHtml($tabAnn['Annonce_Html'], 'Siège : ', '', '.

')); - + $tabAnn['Assoc_Date_Declaration']=htm2txt(@getTextInHtml($tabAnn['Annonce_Html'], '>Date de la déclaration : ', '', '.')); if ($tabAnn['Assoc_Date_Declaration']=='') $tabAnn['Assoc_Date_Declaration']=htm2txt(@getTextInHtml($tabAnn['Annonce_Html'], '>Date de délivrance du récépissé : ', '', '.')); @@ -345,7 +355,6 @@ if ($verif) { $page=getUrl($url, '', '', $referer, false, 'www.journal-officiel.gouv.fr'); $body=$page['body']; - $body = utf8_encode($body); $ctx=@getTextInHtml($body, '
', $page['body']); + + $tabAnnonces=explode('

', utf8_encode($page['body'])); + for ($j=1; $j<26 && isset($tabAnnonces[$j]); $j++) $tabAnn[$j-1]=$tabAnnonces[$j]; randsleep($tempsMinEntreRequetes, $tempsMaxEntreRequetes); @@ -496,14 +506,16 @@ while ($dateCour<=$dateF || $lastJO) { // Boucle sur les dates else $date2=str_replace('/', '%2F', WDate::dateT('Ymd', 'd/m/Y',getNextDate($dateCour))); $url='http://www.journal-officiel.gouv.fr/association/index.php?ctx='.$ctx.'&page='.$i.'&JRE_ID='.urlencode($region).'&JPA_D_D='.$date1.'&JPA_D_F='.$date2; - + } else { $date1='';$date2='';$data='1'; $url='http://www.journal-officiel.gouv.fr/association/index.php?ctx='.$ctx.'&page='.$i; } - + $page=getUrl($url, '', '', $referer, false, 'www.journal-officiel.gouv.fr'); - $tabAnnonces=explode('

', $page['body']); + $tabAnnonces=explode('

', utf8_encode($page['body'])); + + for ($j=1; $j<26; $j++) { $k=$j+(25*($i-1))-1; if ($k<$nbAnnonces) @@ -519,11 +531,10 @@ while ($dateCour<=$dateF || $lastJO) { // Boucle sur les dates else randsleep($tempsMinEntreRequetes, $tempsMaxEntreRequetes); } - + $tabActivites=array(); for ($i=0; $i<$nbAnnonces; $i++) { $infoAnnBalo=getInfosAnnonceAsso($tabAnn[$i], $depotComptes); - $tabInfos=array(); preg_match_all("|(.*)|U", $infoAnnBalo['Annonce_Html'], $tabInfos); $tabInfosGlobal=array_unique(array_merge($tabInfosGlobal, $tabInfos[1])); @@ -538,7 +549,7 @@ while ($dateCour<=$dateF || $lastJO) { // Boucle sur les dates $nbAnnDb=$AnnDb[0]['nb']; $i2=$i+1; $strRegion=', '. $region; - + if ($depotComptes) { $table='asso_bilans'; // Si le bilan PDF n'est pas déjà sur le disk, on va le chercher ! @@ -553,7 +564,7 @@ while ($dateCour<=$dateF || $lastJO) { // Boucle sur les dates $infoAnnBalo['Assoc_Date_Declaration']=$dateCour; $tabPdf=getPdfInfo($repPdfAssoCpt.'/'.basename($infoAnnBalo['pdfLink'])); if (!$tabPdf) { - $page=getUrl('http://www.journal-officiel.gouv.fr/'.$infoAnnBalo['pdfLink'], '', '', '', false); + $page=getUrl('http://www.journal-officiel.gouv.fr/'.$infoAnnBalo['pdfLink'], '', '', '', false); @mkdir($repPdfAssoCpt); $fp=@fopen($repPdfAssoCpt.'/'.basename($infoAnnBalo['pdfLink']), 'w'); if (!fwrite($fp, $page['body']) || !$fp) { @@ -580,11 +591,11 @@ while ($dateCour<=$dateF || $lastJO) { // Boucle sur les dates $message.=date('Y/m/d - H:i:s') ." - Parution du $dateAff $strRegion, Annonce $i2/$nbAnnonces, Association \"". $infoAnnBalo['Assoc_Nom'] .'"... enregistrement'.EOL; echo date('Y/m/d - H:i:s') ." - Parution du $dateAff $strRegion, Annonce $i2/$nbAnnonces, Association \"". $infoAnnBalo['Assoc_Nom'] .'"... enregistrement'.EOL; } - + if (!$iDb->insert($table, $infoAnnBalo)) echo date ('Y/m/d - H:i:s') .' - ERREUR : MySql n°'. mysql_errno() .') : '. mysql_error() . EOL; } - + if ($lastJO) { print_r($tabInfosGlobal); echo date('Y/m/d - H:i:s') .' - FIN du script'. EOL; @@ -596,7 +607,7 @@ while ($dateCour<=$dateF || $lastJO) { // Boucle sur les dates $dateCour=getNextDate($dateCour,1); else $dateCour=getNextDate($dateCour); - + } // Fin boucle Data if ($depotComptes) { @@ -627,7 +638,7 @@ if ($depotComptes) { if (!$iDb->insert('annonces', $tabInsert)) echo '';//date ('Y/m/d - H:i:s') .' - ERREUR : MySql n°'. mysql_errno() .') : '. mysql_error() . EOL; } - sendMail('production@scores-decisions.com', 'ylenaour@scores-decisions.com', 'JO Association Comptes', $message); + sendMail('supportdev@scores-decisions.com', 'support@scores-decisions.com', '[CHARGEMENT] JO Association Comptes', $message); } echo date('Y/m/d - H:i:s') .' - FIN du script.'. EOL; \ No newline at end of file