source: spip-zone/_core_/plugins/textwheel/inc/texte.php @ 48570

Last change on this file since 48570 was 48570, checked in by cedric@…, 10 years ago

retablir $GLOBALStoujours_paragrapher?=true; par defaut (sauf definition contraire personalisee)

File size: 17.8 KB
Line 
1<?php
2
3/***************************************************************************\
4 *  SPIP, Systeme de publication pour l'internet                           *
5 *                                                                         *
6 *  Copyright (c) 2001-2011                                                *
7 *  Arnaud Martin, Antoine Pitrou, Philippe Riviere, Emmanuel Saint-James  *
8 *                                                                         *
9 *  Ce programme est un logiciel libre distribue sous licence GNU/GPL.     *
10 *  Pour plus de details voir le fichier COPYING.txt ou l'aide en ligne.   *
11\***************************************************************************/
12
13if (!defined('_ECRIRE_INC_VERSION')) return;
14
15include_spip('inc/texte_mini');
16include_spip('inc/lien');
17
18include_spip('inc/textwheel');
19
20// Avec cette surcharge, cette globale n'est plus définie, et du coup ça plante dans les plugins qui font un foreach dessus comme ZPIP
21$GLOBALS['spip_raccourcis_typo'] = array();
22if (!isset($GLOBALS['toujours_paragrapher']))
23        $GLOBALS['toujours_paragrapher'] = true;
24
25// class_spip : savoir si on veut class="spip" sur p i strong & li
26// class_spip_plus : class="spip" sur les ul ol h3 hr quote table...
27// la difference c'est que des css specifiques existent pour les seconds
28//
29if (!isset($GLOBALS['class_spip']))
30        $GLOBALS['class_spip'] = '';
31if (!isset($GLOBALS['class_spip_plus']))
32        $GLOBALS['class_spip_plus'] = ' class="spip"';
33
34
35//
36// echapper les < script ...
37//
38function echappe_js($t) {
39        static $wheel = null;
40
41        if (!isset($wheel))
42                $wheel = new TextWheel(
43                        SPIPTextWheelRuleset::loader($GLOBALS['spip_wheels']['echappe_js'])
44                );
45
46        return $wheel->text($t);
47}
48
49//
50// paragagrapher seulement
51//
52function paragrapher($t, $toujours_paragrapher = null) {
53        static $wheel = array();
54        if (is_null($toujours_paragrapher))
55                $toujours_paragrapher = $GLOBALS['toujours_paragrapher'];
56
57        if (!isset($wheel[$toujours_paragrapher])) {
58                $ruleset = SPIPTextWheelRuleset::loader($GLOBALS['spip_wheels']['paragrapher']);
59                if (!$toujours_paragrapher
60                  AND $rule=$ruleset->getRule('toujours-paragrapher')) {
61                        $rule->disabled = true;
62                        $ruleset->addRules(array('toujours-paragrapher'=>$rule));
63                }
64                $wheel[$toujours_paragrapher] = new TextWheel($ruleset);
65        }
66
67        return $wheel[$toujours_paragrapher]->text($t);
68}
69
70
71// Securite : empecher l'execution de code PHP, en le transformant en joli code
72// dans l'espace prive, cette fonction est aussi appelee par propre et typo
73// si elles sont appelees en direct
74// il ne faut pas desactiver globalement la fonction dans l'espace prive car elle protege
75// aussi les balises des squelettes qui ne passent pas forcement par propre ou typo apres
76// http://doc.spip.org/@interdire_scripts
77function interdire_scripts($arg) {
78        // on memorise le resultat sur les arguments non triviaux
79        static $dejavu = array();
80        static $wheel = null;
81
82        // Attention, si ce n'est pas une chaine, laisser intact
83        if (!$arg OR !is_string($arg) OR !strstr($arg, '<')) return $arg; 
84
85        if (isset($dejavu[$GLOBALS['filtrer_javascript']][$arg])) return $dejavu[$GLOBALS['filtrer_javascript']][$arg];
86
87        if (!isset($wheel)){
88                $ruleset = SPIPTextWheelRuleset::loader(
89                        $GLOBALS['spip_wheels']['interdire_scripts']
90                );
91                // Pour le js, trois modes : parano (-1), prive (0), ok (1)
92                // desactiver la regle echappe-js si besoin
93                if ($GLOBALS['filtrer_javascript']==1
94                        OR ($GLOBALS['filtrer_javascript']==0 AND !test_espace_prive()))
95                        $ruleset->addRules (array('securite-js'=>array('disabled'=>true)));
96                $wheel = new TextWheel($ruleset);
97        }
98
99        $t = $wheel->text($arg);
100
101        // Reinserer les echappements des modeles
102        if (defined('_PROTEGE_JS_MODELES'))
103                $t = echappe_retour($t,"javascript"._PROTEGE_JS_MODELES);
104        if (defined('_PROTEGE_PHP_MODELES'))
105                $t = echappe_retour($t,"php"._PROTEGE_PHP_MODELES);
106
107        return $dejavu[$GLOBALS['filtrer_javascript']][$arg] = $t;
108}
109
110
111// Typographie generale
112// avec protection prealable des balises HTML et SPIP
113
114// http://doc.spip.org/@typo
115function typo($letexte, $echapper=true, $connect=null) {
116        // Plus vite !
117        if (!$letexte) return $letexte;
118
119        // les appels directs a cette fonction depuis le php de l'espace
120        // prive etant historiquement ecrit sans argment $connect
121        // on utilise la presence de celui-ci pour distinguer les cas
122        // ou il faut passer interdire_script explicitement
123        // les appels dans les squelettes (de l'espace prive) fournissant un $connect
124        // ne seront pas perturbes
125        $interdire_script = false;
126        if (is_null($connect)){
127                $connect = '';
128                $interdire_script = true;
129        }
130
131        // Echapper les codes <html> etc
132        if ($echapper)
133                $letexte = echappe_html($letexte, 'TYPO');
134
135        //
136        // Installer les modeles, notamment images et documents ;
137        //
138        // NOTE : propre() ne passe pas par ici mais directement par corriger_typo
139        // cf. inc/lien
140
141        $letexte = traiter_modeles($mem = $letexte, false, $echapper ? 'TYPO' : '', $connect);
142        if ($letexte != $mem) $echapper = true;
143        unset($mem);
144
145        $letexte = corriger_typo($letexte);
146        $letexte = echapper_faux_tags($letexte);
147
148        // reintegrer les echappements
149        if ($echapper)
150                $letexte = echappe_retour($letexte, 'TYPO');
151
152        // Dans les appels directs hors squelette, securiser ici aussi
153        if ($interdire_script)
154                $letexte = interdire_scripts($letexte);
155
156        return $letexte;
157}
158
159// Correcteur typographique
160
161define('_TYPO_PROTEGER', "!':;?~%-");
162define('_TYPO_PROTECTEUR', "\x1\x2\x3\x4\x5\x6\x7\x8");
163
164define('_TYPO_BALISE', ",</?[a-z!][^<>]*[".preg_quote(_TYPO_PROTEGER)."][^<>]*>,imsS");
165
166// http://doc.spip.org/@corriger_typo
167function corriger_typo($t, $lang='') {
168        // Plus vite !
169        if (!$t) return $t;
170
171        $t = pipeline('pre_typo', $t);
172
173        // Caracteres de controle "illegaux"
174        $t = corriger_caracteres($t);
175
176        // Proteger les caracteres typographiques a l'interieur des tags html
177        if (preg_match_all(_TYPO_BALISE, $t, $regs, PREG_SET_ORDER)) {
178                foreach ($regs as $reg) {
179                        $insert = $reg[0];
180                        // hack: on transforme les caracteres a proteger en les remplacant
181                        // par des caracteres "illegaux". (cf corriger_caracteres())
182                        $insert = strtr($insert, _TYPO_PROTEGER, _TYPO_PROTECTEUR);
183                        $t = str_replace($reg[0], $insert, $t);
184                }
185        }
186
187        // trouver les blocs multi et les traiter a part
188        $t = extraire_multi($e = $t, $lang, true);
189        $e = ($e === $t);
190
191        // Charger & appliquer les fonctions de typographie
192        $typographie = charger_fonction(lang_typo($lang), 'typographie');
193        $t = $typographie($t);
194
195        // Les citations en une autre langue, s'il y a lieu
196        if (!$e) $t = echappe_retour($t, 'multi');
197
198        // Retablir les caracteres proteges
199        $t = strtr($t, _TYPO_PROTECTEUR, _TYPO_PROTEGER);
200
201        // pipeline
202        $t = pipeline('post_typo', $t);
203
204        # un message pour abs_url - on est passe en mode texte
205        $GLOBALS['mode_abs_url'] = 'texte';
206
207        return $t;
208}
209
210
211//
212// Tableaux
213//
214
215define('_RACCOURCI_TH_SPAN', '\s*(:?{{[^{}]+}}\s*)?|<');
216
217// http://doc.spip.org/@traiter_tableau
218function traiter_tableau($bloc) {
219        // id "unique" pour les id du tableau
220        $tabid = substr(md5($bloc),0,4);
221
222        // Decouper le tableau en lignes
223        preg_match_all(',([|].*)[|]\n,UmsS', $bloc, $regs, PREG_PATTERN_ORDER);
224        $lignes = array();
225        $debut_table = $summary = '';
226        $l = 0;
227        $numeric = true;
228
229        // Traiter chaque ligne
230        $reg_line1 = ',^(\|(' . _RACCOURCI_TH_SPAN . '))+$,sS';
231        $reg_line_all = ',^('  . _RACCOURCI_TH_SPAN . ')$,sS';
232        $hc = $hl = array();
233        foreach ($regs[1] as $ligne) {
234                $l ++;
235
236                // Gestion de la premiere ligne :
237                if ($l == 1) {
238                // - <caption> et summary dans la premiere ligne :
239                //   || caption | summary || (|summary est optionnel)
240                        if (preg_match(',^\|\|([^|]*)(\|(.*))?$,sS', rtrim($ligne,'|'), $cap)) {
241                                $l = 0;
242                                if ($caption = trim($cap[1]))
243                                        $debut_table .= "<caption>".$caption."</caption>\n";
244                                $summary = ' summary="'.entites_html(trim($cap[3])).'"';
245                        }
246                // - <thead> sous la forme |{{titre}}|{{titre}}|
247                //   Attention thead oblige a avoir tbody
248                        else if (preg_match($reg_line1, $ligne, $thead)) {
249                                preg_match_all('/\|([^|]*)/S', $ligne, $cols);
250                                $ligne='';$cols= $cols[1];
251                                $colspan=1;
252                                for($c=count($cols)-1; $c>=0; $c--) {
253                                        $attr='';
254                                        if($cols[$c]=='<') {
255                                          $colspan++;
256                                        } else {
257                                          if($colspan>1) {
258                                                $attr= " colspan='$colspan'";
259                                                $colspan=1;
260                                          }
261                                          // inutile de garder le strong qui n'a servi que de marqueur
262                                          $cols[$c] = str_replace(array('{','}'), '', $cols[$c]);
263                                          $ligne= "<th id='id{$tabid}_c$c'$attr>$cols[$c]</th>$ligne";
264                                                $hc[$c] = "id{$tabid}_c$c"; // pour mettre dans les headers des td
265                                        }
266                                }
267
268                                $debut_table .= "<thead><tr class='row_first'>".
269                                        $ligne."</tr></thead>\n";
270                                $l = 0;
271                        }
272                }
273
274                // Sinon ligne normale
275                if ($l) {
276                        // Gerer les listes a puce dans les cellules
277                        if (strpos($ligne,"\n-*")!==false OR strpos($ligne,"\n-#")!==false)
278                                $ligne = traiter_listes($ligne);
279
280                        // Pas de paragraphes dans les cellules
281                        $ligne = preg_replace("/\n{2,}/", "<br /><br />\n", $ligne);
282
283                        // tout mettre dans un tableau 2d
284                        preg_match_all('/\|([^|]*)/S', $ligne, $cols);
285                        $lignes[]= $cols[1];
286                }
287        }
288
289        // maintenant qu'on a toutes les cellules
290        // on prepare une liste de rowspan par defaut, a partir
291        // du nombre de colonnes dans la premiere ligne.
292        // Reperer egalement les colonnes numeriques pour les cadrer a droite
293        $rowspans = $numeric = array();
294        $n = count($lignes[0]);
295        $k = count($lignes);
296        // distinguer les colonnes numeriques a point ou a virgule,
297        // pour les alignements eventuels sur "," ou "."
298        $numeric_class = array('.'=>'point',','=>'virgule');
299        for($i=0;$i<$n;$i++) {
300          $align = true;
301          for ($j=0;$j<$k;$j++) {
302                  $rowspans[$j][$i] = 1;
303                        if ($align AND preg_match('/^\d+([.,]?)\d*$/', trim($lignes[$j][$i]), $r)){
304                                if ($r[1])
305                                        $align = $r[1];
306                        }
307                        else
308                                $align = '';
309          }
310          $numeric[$i] = $align ? (" class='numeric ".$numeric_class[$align]."'") : '';
311        }
312        for ($j=0;$j<$k;$j++) {
313                if (preg_match($reg_line_all, $lignes[$j][0])) {
314                        $hl[$j] = "id{$tabid}_l$j"; // pour mettre dans les headers des td
315                }
316                else
317                        unset($hl[0]);
318        }
319        if (!isset($hl[0]))
320                $hl = array(); // toute la colonne ou rien
321
322        // et on parcourt le tableau a l'envers pour ramasser les
323        // colspan et rowspan en passant
324        $html = '';
325
326        for($l=count($lignes)-1; $l>=0; $l--) {
327                $cols= $lignes[$l];
328                $colspan=1;
329                $ligne='';
330
331                for($c=count($cols)-1; $c>=0; $c--) {
332                        $attr= $numeric[$c]; 
333                        $cell = trim($cols[$c]);
334                        if($cell=='<') {
335                          $colspan++;
336
337                        } elseif($cell=='^') {
338                          $rowspans[$l-1][$c]+=$rowspans[$l][$c];
339
340                        } else {
341                          if($colspan>1) {
342                                $attr .= " colspan='$colspan'";
343                                $colspan=1;
344                          }
345                          if(($x=$rowspans[$l][$c])>1) {
346                                $attr.= " rowspan='$x'";
347                          }
348                          $b = ($c==0 AND isset($hl[$l]))?'th':'td';
349                                $h = (isset($hc[$c])?$hc[$c]:'').' '.(($b=='td' AND isset($hl[$l]))?$hl[$l]:'');
350                                if ($h=trim($h))
351                                        $attr.=" headers='$h'";
352                                // inutile de garder le strong qui n'a servi que de marqueur
353                                if ($b=='th') {
354                                        $attr.=" id='".$hl[$l]."'";
355                                        $cols[$c] = str_replace(array('{','}'), '', $cols[$c]);
356                                }
357                          $ligne= "\n<$b".$attr.'>'.$cols[$c]."</$b>".$ligne;
358                        }
359                }
360
361                // ligne complete
362                $class = alterner($l+1, 'odd', 'even');
363                $html = "<tr class='row_$class $class'>$ligne</tr>\n$html";
364        }
365        return "\n\n<table".$GLOBALS['class_spip_plus'].$summary.">\n"
366                . $debut_table
367                . "<tbody>\n"
368                . $html
369                . "</tbody>\n"
370                . "</table>\n\n";
371}
372
373
374//
375// Traitement des listes (merci a Michael Parienti)
376//
377// http://doc.spip.org/@traiter_listes
378function traiter_listes ($texte) {
379        global $class_spip, $class_spip_plus;
380        $parags = preg_split(",\n[[:space:]]*\n,S", $texte);
381        $texte ='';
382
383        // chaque paragraphe est traite a part
384        while (list(,$para) = each($parags)) {
385                $niveau = 0;
386                $pile_li = $pile_type = array();
387                $lignes = explode("\n-", "\n" . $para);
388
389                // ne pas toucher a la premiere ligne
390                list(,$debut) = each($lignes);
391                $texte .= $debut;
392
393                // chaque item a sa profondeur = nb d'etoiles
394                $type ='';
395                while (list(,$item) = each($lignes)) {
396                        preg_match(",^([*]*|[#]*)([^*#].*)$,sS", $item, $regs);
397                        $profond = strlen($regs[1]);
398
399                        if ($profond > 0) {
400                                $ajout='';
401
402                                // changement de type de liste au meme niveau : il faut
403                                // descendre un niveau plus bas, fermer ce niveau, et
404                                // remonter
405                                $nouv_type = (substr($item,0,1) == '*') ? 'ul' : 'ol';
406                                $change_type = ($type AND ($type <> $nouv_type) AND ($profond == $niveau)) ? 1 : 0;
407                                $type = $nouv_type;
408
409                                // d'abord traiter les descentes
410                                while ($niveau > $profond - $change_type) {
411                                        $ajout .= $pile_li[$niveau];
412                                        $ajout .= $pile_type[$niveau];
413                                        if (!$change_type)
414                                                unset ($pile_li[$niveau]);
415                                        $niveau --;
416                                }
417
418                                // puis les identites (y compris en fin de descente)
419                                if ($niveau == $profond && !$change_type) {
420                                        $ajout .= $pile_li[$niveau];
421                                }
422
423                                // puis les montees (y compris apres une descente un cran trop bas)
424                                while ($niveau < $profond) {
425                                        if ($niveau == 0) $ajout .= "\n\n";
426                                        elseif (!isset($pile_li[$niveau])) {
427                                                $ajout .= "<li$class_spip>";
428                                                $pile_li[$niveau] = "</li>";
429                                        }
430                                        $niveau ++;
431                                        $ajout .= "<$type$class_spip_plus>";
432                                        $pile_type[$niveau] = "</$type>";
433                                }
434
435                                $ajout .= "<li$class_spip>";
436                                $pile_li[$profond] = "</li>";
437                        }
438                        else {
439                                $ajout = "\n-"; // puce normale ou <hr>
440                        }
441
442                        $texte .= $ajout . $regs[2];
443                }
444
445                // retour sur terre
446                $ajout = '';
447                while ($niveau > 0) {
448                        $ajout .= $pile_li[$niveau];
449                        $ajout .= $pile_type[$niveau];
450                        $niveau --;
451                }
452                $texte .= $ajout;
453
454                // paragraphe
455                $texte .= "\n\n";
456        }
457
458        // sucrer les deux derniers \n
459        return substr($texte, 0, -2);
460}
461
462// http://doc.spip.org/@traiter_poesie
463function traiter_poesie($letexte)
464{
465        if (preg_match_all(",<(poesie|poetry)>(.*)<\/(poesie|poetry)>,UimsS",
466        $letexte, $regs, PREG_SET_ORDER)) {
467                $u = "/\n[\s]*\n/S" . $GLOBALS['meta']['pcre_u'];
468                foreach ($regs as $reg) {
469                        $lecode = preg_replace(",\r\n?,S", "\n", $reg[2]);
470                        $lecode = preg_replace($u, "\n&nbsp;\n",$lecode);
471                        $lecode = "<blockquote class=\"spip_poesie\">\n<div>"
472                                .preg_replace("/\n+/", "</div>\n<div>", trim($lecode))
473                                ."</div>\n</blockquote>\n\n";
474                        $letexte = str_replace($reg[0], $lecode, $letexte);
475                }
476        }
477        return $letexte;
478}
479
480// Harmonise les retours chariots et mange les paragraphes html
481// http://doc.spip.org/@traiter_retours_chariots
482function traiter_retours_chariots($letexte) {
483        $letexte = preg_replace(",\r\n?,S", "\n", $letexte);
484        $letexte = preg_replace(",<p[>[:space:]],iS", "\n\n\\0", $letexte);
485        $letexte = preg_replace(",</p[>[:space:]],iS", "\\0\n\n", $letexte);
486        return $letexte;
487}
488
489// Ces deux constantes permettent de proteger certains caracteres
490// en les remplacanat par des caracteres "illegaux". (cf corriger_caracteres)
491
492define('_RACCOURCI_PROTEGER', "{}_-");
493define('_RACCOURCI_PROTECTEUR', "\x1\x2\x3\x4");
494
495define('_RACCOURCI_BALISE', ",</?[a-z!][^<>]*[".preg_quote(_RACCOURCI_PROTEGER)."][^<>]*>,imsS");
496
497// Nettoie un texte, traite les raccourcis autre qu'URL, la typo, etc.
498
499// mais d'abord, une callback de reconfiguration des raccourcis
500// a partir de globales (est-ce old-style ? on conserve quand meme
501// par souci de compat ascendante)
502function personnaliser_raccourcis(&$ruleset){
503        if (isset($GLOBALS['debut_intertitre']) AND $rule=$ruleset->getRule('intertitres')){
504                $rule->replace[0] = preg_replace(',<[^>]*>,Uims',$GLOBALS['debut_intertitre'],$rule->replace[0]);
505                $rule->replace[1] = preg_replace(',<[^>]*>,Uims',$GLOBALS['fin_intertitre'],$rule->replace[1]);
506                $ruleset->addRules(array('intertitres'=>$rule));
507        }
508        if (isset($GLOBALS['debut_gras']) AND $rule=$ruleset->getRule('gras')){
509                $rule->replace[0] = preg_replace(',<[^>]*>,Uims',$GLOBALS['debut_gras'],$rule->replace[0]);
510                $rule->replace[1] = preg_replace(',<[^>]*>,Uims',$GLOBALS['fin_gras'],$rule->replace[1]);
511                $ruleset->addRules(array('gras'=>$rule));
512        }
513        if (isset($GLOBALS['debut_italique']) AND $rule=$ruleset->getRule('italiques')){
514                $rule->replace[0] = preg_replace(',<[^>]*>,Uims',$GLOBALS['debut_italique'],$rule->replace[0]);
515                $rule->replace[1] = preg_replace(',<[^>]*>,Uims',$GLOBALS['fin_italique'],$rule->replace[1]);
516                $ruleset->addRules(array('italiques'=>$rule));
517        }
518        if (isset($GLOBALS['ligne_horizontale']) AND $rule=$ruleset->getRule('ligne-horizontale')){
519                $rule->replace = preg_replace(',<[^>]*>,Uims',$GLOBALS['ligne_horizontale'],$rule->replace);
520                $ruleset->addRules(array('ligne-horizontale'=>$rule));
521        }
522        if (isset($GLOBALS['toujours_paragrapher']) AND !$GLOBALS['toujours_paragrapher']
523          AND $rule=$ruleset->getRule('toujours-paragrapher')) {
524                $rule->disabled = true;
525                $ruleset->addRules(array('toujours-paragrapher'=>$rule));
526        }
527}
528
529// http://doc.spip.org/@traiter_raccourcis
530function traiter_raccourcis($t) {
531        static $wheel;
532        // Appeler les fonctions de pre_traitement
533        $t = pipeline('pre_propre', $t);
534
535        if (!isset($wheel)) {
536                $ruleset = SPIPTextWheelRuleset::loader(
537                        $GLOBALS['spip_wheels']['raccourcis'],'personnaliser_raccourcis'
538                );
539                $wheel = new TextWheel($ruleset);
540
541                if (_request('var_mode') == 'wheel'
542                AND autoriser('debug')) {
543                        $f = $wheel->compile();
544                        echo "<pre>\n".htmlspecialchars($f)."</pre>\n";
545                        exit;
546                }
547        }
548
549        // Gerer les notes (ne passe pas dans le pipeline)
550        $notes = charger_fonction('notes', 'inc');
551        list($t, $mes_notes) = $notes($t);
552
553        $t = $wheel->text($t);
554
555        // Appeler les fonctions de post-traitement
556        $t = pipeline('post_propre', $t);
557
558        if ($mes_notes)
559                $notes($mes_notes);
560
561        return $t;
562}
563
564
565// Filtre a appliquer aux champs du type #TEXTE*
566// http://doc.spip.org/@propre
567function propre($t, $connect=null) {
568        // les appels directs a cette fonction depuis le php de l'espace
569        // prive etant historiquement ecrits sans argment $connect
570        // on utilise la presence de celui-ci pour distinguer les cas
571        // ou il faut passer interdire_script explicitement
572        // les appels dans les squelettes (de l'espace prive) fournissant un $connect
573        // ne seront pas perturbes
574        $interdire_script = false;
575        if (is_null($connect)){
576                $connect = '';
577                $interdire_script = true;
578        }
579
580        if (!$t) return strval($t);
581
582        $t = echappe_html($t);
583        $t = expanser_liens($t,$connect);
584        $t = traiter_raccourcis($t);
585        $t = echappe_retour_modeles($t, $interdire_script);
586
587        return $t;
588}
589?>
Note: See TracBrowser for help on using the repository browser.