Changeset 100553 in spip-zone


Ignore:
Timestamp:
Nov 17, 2016, 12:30:22 PM (3 years ago)
Author:
booz@…
Message:

debug

Location:
_plugins_/convertisseur/trunk
Files:
2 edited

Legend:

Unmodified
Added
Removed
  • _plugins_/convertisseur/trunk/extract/xml_de.php

    r100366 r100553  
    5757        $u = extraire_balise($u,'red');
    5858        //$u = str_replace("\n",'',$u);
    59 
    60         if( ($ti = trim(textebrut(extraire_balise($u,'Titel')))) != $m['titre'])
    61                 $m['alertes'][] = "Embrouille sur le titre : $ti >> " . $m['titre'] ;
     59        $ti = trim(textebrut(extraire_balise($u,'Titel'))) ;
     60        if( ($ti != trim($m['titre'])))
     61                $m['alertes'][] = "Embrouille sur le titre : >$ti< != > " . trim($m['titre']) . "<";
    6262 
    6363        // attention il peut y avoir un encadré plus bas avec un second titre.
     
    9696        //      <Fett>Fußnoten:<br/></Fett>
    9797        $u = preg_replace('/<Fett>\s*Fu(ß|ss)note(n)*\s*:*\s*(<br\s*\/>)*\s*<\/Fett>(\s*<br\s*\/>)*/Us','',$u);
    98 
    99         // menage
    100         $u = preg_replace('~<Fussnote>\s+</Fussnote>~Uums','',$u);
    101 
    102 
    10398        // liens
    10499        // <URL href="http://www.un.org/terrorism">www.un.org/terrorism</URL>
     
    145140        //<Korrespondent>Von IGNACIO RAMONET</Korrespondent> 2003_01_17/art005.xml
    146141        $u = preg_replace('%<Korrespondent>[^<]*</Korrespondent>%Us','',$u);
     142
     143        // Traducteur // signature // crédit 1)
    147144
    148145        // <Kursiv>     dt. Bodo Schulze</Kursiv>
     
    157154               
    158155                //echo(htmlspecialchars($matches[0]));
    159                
     156                //echo(htmlspecialchars($u));
     157
    160158                // parenthese pour chercher une bio en fin de notes apres le traducteur
    161159                // voir aussi plus bas
    162160                if(preg_match("~" . preg_quote($matches[0]) . "(.{2}.+)</Fussnote>~Uuims", $u , $b)){
    163161                        if($b[1]){
     162                                //echo(htmlspecialchars($b[1]));
     163                                // signature avec un crédit en prime ?
     164                                if(preg_match("/©.*/", $b[1], $cre)){
     165                                        //echo(htmlspecialchars($cre[0]));
     166                                        $credit = $cre[0] ;
     167                                        $b[1] = str_replace($credit, "", $b[1]);
     168                                        $u = str_replace($credit,"",$u);
     169                                }
    164170                                $m['signature'] .= $b[1] ;
    165                                 $u = str_replace($b[1],'',$u);
    166                                 $flag_signature = false ;                               
     171                                $u = str_replace($b[1],"",$u);
     172                                $flag_signature = false ;
    167173                        }
    168                 }               
    169                 $u = str_replace($matches[0],'',$u);
    170         }
     174                }
     175               
     176                // On vire le traducteur, et on remet le crédit le cas échéant pour la suite
     177                if($credit)
     178                        $repl = trim($credit) ;
     179                else
     180                        $repl = "";
     181                $u = str_replace($matches[0],$repl,$u);
     182                //echo(htmlspecialchars($u));
     183        }
     184
     185                //echo(htmlspecialchars($u));
     186
     187
    171188       
    172189        // pas de <br /> dans un <brot> 1996_05_10/art299.xml
     
    182199        // <Fussnote>(.*)</Fussnote>
    183200        // <Fussnote>* Journalist, Jerusalem.</Fussnote>
    184        
     201        // <Fussnote>© Le Monde diplomatique, Berlin</Fussnote>
    185202        //<Fussnote>
    186203//José López Mazz ist Professor für Anthropologie an der Universidad de la República, Montevideo.</Fussnote>
     
    191208        if(preg_match_all("%<Fussnote>(.*)</Fussnote>%Us",$u,$matches)){
    192209               
    193                 //var_dump($matches[1]);
     210                //var_dump("<textarea>", $u, "</textarea>", "<pre>", $matches, "</pre>");
    194211               
    195212                for($i=0 ; $i < sizeof($matches[1]) ; $i++){
     
    200217                                ){
    201218                                //var_dump(htmlspecialchars($u),$matches[1][$i]);
    202                                 $note_signature = trim(preg_replace('/^\s*\*\s*/','',$matches[1][$i])) ;
    203                                 if($note_signature !== ""){
    204                                         $m['signature'] .= $note_signature . "\n\n" ;
    205                                         $u = str_replace($matches[0][$i],'',$u);
    206                                         $flag_signature = false ;       
    207                                 }       
    208                         }                       
     219                               
     220                                // Crédit ou signature ?
     221                                if(preg_match("/©.*/", $matches[1][$i])){
     222                                        $credit = $matches[1][$i] ;
     223                                        // On met le crédit en note non numérotée
     224                                        $u = str_replace($matches[0][$i],"\n[[<> $credit]]\n",$u);
     225                                }else{
     226                                        $note_signature = trim(preg_replace('/^\s*\*\s*/','',$matches[1][$i])) ;
     227                                        if($note_signature !== ""){
     228                                                $m['signature'] .= $note_signature . "\n\n" ;
     229                                                $u = str_replace($matches[0][$i],'',$u);
     230                                                $flag_signature = false ;       
     231                                        }
     232                                }
     233                        }
    209234                }       
    210235        }
     
    272297        // Chapo <Initial>
    273298        if(preg_match("%<Initial>(.*)</Initial>%Us",$u,$matches)){
    274                 $m['chapo'] .= trim(textebrut($matches[1])) ;
     299                $m['chapo'] .= trim($matches[1]) ;
    275300                $u = str_replace($matches[0],'',$u);
    276301                $m['logs'][] = "Suppression de (chapo): " . entites_html($matches[0]) ;         
     
    293318        $u = str_replace("<Zitat>","<quote>",$u);
    294319        $u = str_replace("</Zitat>","</quote>",$u);
    295                
     320
    296321        // images des pages.
    297322        $images_balises = extraire_balises($u,"PdfFile");
     
    315340                        $m[$t] = str_replace("</Fett>","}}",$m[$t]);
    316341                       
     342                        //  Pas d'indice ou exposant
     343                        $m[$t] = preg_replace(',</?Tief>,U',"",$m[$t]); // sinon on mettrait <sub> et <exp>
     344                       
    317345                        // menage
    318346                        // notes de bas de page :
    319347                        $m[$t] = preg_replace(',</?Fussnote>,U',"\n\n",$m[$t]); //pb d'espace fine ? en fin de hoch 2002_07_12/art002.xml
    320                        
    321 
    322         }
    323        
    324 
     348        }
    325349        return $m ;
    326350}
  • _plugins_/convertisseur/trunk/spip-cli/convertisseurConvertir.php

    r100519 r100553  
    164164                                        );
    165165                                       
    166                                         // traitements persos sur $c avant d'écrire le fichier converti ?
     166                                        // traitements persos sur $c avant d'écrire le fichier converti
    167167                                        if(find_in_path('convertisseur_perso.php'))
    168168                                                include_spip("convertisseur_perso");
Note: See TracChangeset for help on using the changeset viewer.