source: spip-zone/_plugins_/valider_xml/exec/valider_xml.php @ 108307

Last change on this file since 108307 was 108307, checked in by marcimat@…, 3 years ago

Ce plugin "Valider XML" reçoit l’actuel exec=valider_xml de SPIP < 3.3-dev.

Cette page de visualisation ne sert pas directement à SPIP, donc je la sors du core, d’autant qu’elle ne fonctionne actuellement pas :

  • tester un répertoire donne de nombreuses notices et le tableau résultant n’affiche pas grand chose,
  • tester une url est impossible (bloquée par l’écran de sécurité)

Si la fonctionnalité est utile à certain·es, le plugin est là pour être modifié, amélioré, etc.

File size: 13.8 KB
Line 
1<?php
2
3/***************************************************************************\
4 *  SPIP, Systeme de publication pour l'internet                           *
5 *                                                                         *
6 *  Copyright (c) 2001-2017                                                *
7 *  Arnaud Martin, Antoine Pitrou, Philippe Riviere, Emmanuel Saint-James  *
8 *                                                                         *
9 *  Ce programme est un logiciel libre distribue sous licence GNU/GPL.     *
10 *  Pour plus de details voir le fichier COPYING.txt ou l'aide en ligne.   *
11\***************************************************************************/
12
13/**
14 * Gestion de la validation XML selon une DTD
15 *
16 * @package SPIP\Core\Valider_XML
17 */
18
19if (!defined('_ECRIRE_INC_VERSION')) {
20        return;
21}
22include_spip('inc/presentation');
23include_spip('public/debusquer');
24
25
26/**
27 * Page d'affichage des résultats de validation XML selon une DTD
28 *
29 * - l'argument var_url peut indiquer un fichier ou un repertoire
30 * - l'argument ext peut valoir "php" ou "html"
31 * -- Si "php", le script est execute et la page valide
32 * -- Si "html", on suppose que c'est un squelette dont on devine les args
33 *    en cherchant les occurrences de Pile[0].
34 *
35 * @example
36 *     ```
37 *     ecrire?exec=valider_xml&var_url=exec&ext=php pour tester l'espace prive
38 *     ecrire?exec=valider_xml&var_url=../squelettes-dist&ext=html pour le public
39 *     ```
40 *
41 * @uses valider_xml_ok()
42 **/
43function exec_valider_xml_dist() {
44        if (!autoriser('webmestre')) {
45                include_spip('inc/minipres');
46                echo minipres();
47        } else {
48                $erreur = "";
49                // verifier que les var de l'URL sont conformes avant d'appeler la fonction
50                $url = trim(_request('var_url'));
51                if (strncmp($url,'/',1)==0) $erreur = 'Chemin absolu interdit pour var_url';
52                // on a pas le droit de remonter plus de 1 fois dans le path (pas 2 occurences de ../ ou ..\ (win))
53                if (($p=strpos($url,'..'))!==false AND strpos($url,'..',$p+3)!==false) $erreur = 'Interdit de remonter en dehors de la racine';
54                if (strpos($url,'://')!==false or strpos($url,':\\')!==false) $erreur = 'URL absolue interdite pour var_url';
55
56                $ext = trim(_request('ext'));
57                $ext = ltrim($ext,'.'); // precaution
58                if (preg_match('/\W/',$ext)) $erreur = 'Extension invalide';
59
60                // en GET var_url doit etre signee, en POST seule l'action est signee
61                // CSRF safe
62                $process = true;
63                if ($url){
64                        include_spip('inc/securiser_action');
65                        if ($_SERVER["REQUEST_METHOD"]=='POST'){
66                                if (!$token = _request('var_token')
67                                  or !verifier_cle_action("valider_xml",$token)){
68                                        $process = false;
69                                }
70                        }
71                        if ($_SERVER["REQUEST_METHOD"]!='POST'){
72                                if (!$token = _request('var_token')
73                                  or !verifier_cle_action("valider_xml&var_url=$url",$token)){
74                                        $process = false;
75                                }
76                        }
77                }
78
79                if ($erreur){
80                        include_spip('inc/minipres');
81                        echo minipres($erreur);
82                }
83                else {
84                        valider_xml_ok($url, $ext, intval(_request('limit')), _request('recur'), $process);
85                }
86        }
87}
88
89/**
90 * Vérifie le formatage d'un xml
91 *
92 * @see valider_resultats()
93 * @see valider_dir()
94 * @see valider_pseudo_url()
95 *
96 * @param string $url
97 * @param string $req_ext
98 * @param int $limit
99 * @param array|bool $rec
100 * @param bool $process
101 *
102 **/
103function valider_xml_ok($url, $req_ext, $limit, $rec, $process = true) {
104        $url = urldecode($url);
105        $rec = !$rec ? false : array();
106        $res = '';
107        if (!$limit) {
108                $limit = 200;
109        }
110        $titre = _T('analyse_xml');
111        if (!$url) {
112                $url_aff = '';
113                $bandeau = $err = '';
114        } else {
115                include_spip('inc/distant');
116
117                if (is_dir($url)) {
118                        $dir = (substr($url, -1, 1) === '/') ? $url : "$url/";
119                        $ext = !preg_match('/^[.*\w]+$/', $req_ext) ? 'php' : $req_ext;
120                        $files = preg_files($dir, "$ext$", $limit, $rec);
121                        if (!$files and $ext !== 'html') {
122                                $files = preg_files($dir, 'html$', $limit, $rec);
123                                if ($files) {
124                                        $ext = 'html';
125                                }
126                        }
127                        if ($files) {
128                                $res = valider_dir($files, $ext, $url);
129                                list($err, $res) = valider_resultats($res, $ext === 'html');
130                                $err = ' (' . $err . '/' . count($files) . ')';
131                        } else {
132                                $res = _T('texte_vide');
133                                $err = '';
134                        }
135                        $bandeau = $dir . '*' . $ext . $err;
136                } else {
137                        if (preg_match('@^((?:[.]/)?[^?]*)[?]([0-9a-z_]+)=([^&]*)(.*)$@', $url, $r)) {
138                                list(, $server, $dir, $script, $args) = $r;
139                                if (((!$server) or ($server == './')
140                                                or strpos($server, url_de_base()) === 0)
141                                        and is_dir($dir)
142                                ) {
143                                        $url = $script;
144                                        // Pour quand le validateur saura simuler
145                                        // une query-string...
146                                        // $args = preg_split('/&(amp;)?[a-z0-9_]+=/', $args);
147                                        $args = true;
148                                }
149                        } else {
150                                $dir = 'exec';
151                                $script = $url;
152                                $args = true;
153                        }
154
155                        $url_aff = entites_html($url);
156                        $bandeau = "";
157                        if ($process) {
158                                $transformer_xml = charger_fonction('valider', 'xml');
159                                if (preg_match(',^[a-z][0-9a-z_]*$,i', $url)) {
160                                        $res = $transformer_xml(charger_fonction($url, $dir), $args);
161                                        $url_aff = valider_pseudo_url($dir, $script);
162                                } else {
163                                        $res = $transformer_xml(recuperer_page($url));
164                                        $url_aff = entites_html($url);
165                                }
166                                list($texte, $err) = emboite_texte($res);
167                                if (!$err) {
168                                        $err = '<h3>' . _T('spip_conforme_dtd') . '</h3>';
169                                }
170                                $res =
171                                        "<div style='text-align: center'>" . $err . "</div>" .
172                                        "<div style='margin: 10px; text-align: left'>" . $texte . '</div>';
173                                $bandeau = "<a href='$url_aff'>".$url_aff."</a>";
174                        }
175
176                }
177        }
178
179        $commencer_page = charger_fonction('commencer_page', 'inc');
180        $debut = $commencer_page($titre);
181        $jq = http_script("", 'jquery.js');
182
183
184        echo str_replace('<head>', "<head>$jq", $debut);
185        include_spip('inc/securiser_action');
186        $token = calculer_cle_action("valider_xml");
187        $texte = '<input type="text" size="70" value="' . $url_aff . '" name="var_url" id="var_url" placeholder="http://" />';
188        $texte .= '<input type="hidden" value="' . $token . '" name="var_token" />';
189        $texte .= '<input type="hidden" value="' . $req_ext . '" name="ext" />';
190        $texte .= '<input type="submit" value="Go" />';
191        $texte = generer_form_ecrire('valider_xml', $texte, " method='post'");
192
193        $self = generer_url_ecrire('valider_xml');
194        $self = parametre_url($self, 'var_url', $url);
195        $self = parametre_url($self, 'ext', $req_ext);
196        $self = parametre_url($self, 'limit', $limit);
197        $self = parametre_url($self, 'rec', $rec);
198        $self = "<a href='$self'>$self</a>";
199
200        echo "<h1 class='grostitre'>", $titre, " <small>$bandeau</small>", '</h1>',
201        "<div style='text-align: center'>", $texte, "</div>",
202        $res,
203        "<br /><br /><p><small>$self</small></p>",
204        fin_page();
205}
206
207/**
208 *
209 * Vérifie la conformité du xml, élément par élément.
210 *
211 * @param array $res
212 * @param string $mode
213 * @return array
214 **/
215function valider_resultats($res, $mode) {
216        include_spip('inc/securiser_action');
217        $i = $j = 0;
218        $table = '';
219        rsort($res);
220        foreach ($res as $l) {
221                $i++;
222                $class = 'row_' . alterner($i, 'even', 'odd');
223                list($nb, $texte, $erreurs, $script, $appel, $temps) = $l;
224                if ($texte < 0) {
225                        $texte = (0 - $texte);
226                        $color = ";color: red";
227                } else {
228                        $color = '';
229                }
230
231                $err = (!intval($nb)) ? '' :
232                        ($erreurs[0][0] . ' ' . _T('ligne') . ' ' .
233                                $erreurs[0][1] . ($nb == 1 ? '' : '  ...'));
234                if ($err) {
235                        $j++;
236                }
237                if ($mode) {
238                        $h = $appel . '&var_mode=debug&var_mode_affiche=validation';
239                }
240                else {
241                        $h = generer_url_ecrire('valider_xml', "var_url=" . urlencode($appel));
242                        $h = parametre_url($h,'var_token', calculer_cle_action("valider_xml&var_url=$appel"));
243                }
244
245                $table .= "<tr class='$class'>"
246                        . "<td style='text-align: right'>$nb</td>"
247                        . "<td style='text-align: right$color'>$texte</td>"
248                        . "<td style='text-align: right'>$temps</td>"
249                        . "<td style='text-align: left'>$err</td>"
250                        . "<td>$script</td>"
251                        . "<td><a href='$h'>$appel</a></td>";
252        }
253
254        return array(
255                $j,
256                "<table class='spip'>"
257                . "<tr><th>"
258                . _T('erreur_texte')
259                . "</th><th>"
260                . _T('taille_octets', array('taille' => ' '))
261                . "</th><th>"
262                . _T('zbug_profile', array('time' => ''))
263                . "</th><th>"
264                . _T('message')
265                . "</th><th>Page</th><th>args"
266                . "</th></tr>"
267                . $table
268                . "</table>"
269        );
270}
271
272/**
273 * Valide l'existence d'un script ou d'une fonction
274 *
275 * @uses valider_pseudo_url()
276 *
277 * @param string $transformer_xml
278 * @param string $script
279 *  Nom de la fonction à charger
280 * @param string $dir
281 *  Nom du répertoire qui contiendrait le fichier et/ou la fonction à chercher/charger.
282 * @param string $ext
283 *  Nom de l'extension du fichier contenant la fonction à vérifier.
284 * @return array
285 */
286function valider_script($transformer_xml, $script, $dir, $ext) {
287        $script = basename($script, '.php');
288        $dir = basename($dir);
289        $f = charger_fonction($script, $dir, true);
290
291        // ne pas se controler soi-meme ni l'index du repertoire ni un fichier annexe
292        if ($script == _request('exec') or $script == 'index' or !$f) {
293                return array('/', 0, '', $script, '');
294        }
295
296        $val = $transformer_xml($f, true);
297        $appel = '';
298
299        // s'il y a l'attribut minipres, le test est non significatif
300        // le script necessite peut-etre des arguments, on lui en donne,
301        // en appelant la fonction _args associee si elle existe
302        // Si ca ne marche toujours pas, les arguments n'étaient pas bons
303        // ou c'est une authentification pour action d'administration;
304        // tant pis, on signale le cas par un resultat negatif
305
306        if (strpos($val->page, "id='minipres'")) {
307                if (!$g = charger_fonction($script . '_args', $dir, true)) {
308                        $res = 0 - strlen($val->page);
309                } else {
310                        $args = array(1, 'id_article', 1);
311                        $val = $transformer_xml($g, $args);
312                        $appel = 'id_article=1&type=id_article&id=1';
313                        if (strpos($val->page, "id='minipres'")) {
314                                $res = 0 - strlen($val->page);
315                        } else {
316                                $res = strlen($val->page);
317                        }
318                }
319        } else {
320                $res = strlen($val->page);
321        }
322
323        $appel = valider_pseudo_url($dir, $script, $appel);
324        $err = $val->err;
325
326        return array(count($err), $res, $err, $script, $appel);
327}
328
329/**
330 * Construire la bonne URL selon l'endroit où on se trouve.
331 *
332 * @param string $dir
333 *     Par défaut, on vérifie si on est sur une page `?exec=XX`
334 * @param string $script
335 * @param string $args [description]
336 * @return string
337 */
338function valider_pseudo_url($dir, $script, $args = '') {
339        return ($dir == 'exec')
340                ? generer_url_ecrire($script, $args, false, true)
341                : ("./?$dir=$script" . ($args ? "&$args" : ''));
342}
343
344/**
345 * Essayer de valider un texte même sans Doctype
346 * à moins qu'un Content-Type dise clairement que ce n'est pas du XML
347 *
348 * @param string $transformer_xml
349 * @param string $file
350 * @param string $dir
351 * @param string $ext
352 * @return array
353 */
354function valider_skel($transformer_xml, $file, $dir, $ext) {
355        if (!lire_fichier($file, $text)) {
356                return array('/', '/', $file, '');
357        }
358        if (!strpos($text, 'DOCTYPE')) {
359                preg_match(",Content[-]Type: *\w+/(\S)+,", $text, $r);
360                if ($r[1] === 'css' or $r[1] === 'plain') {
361                        return array('/', 'DOCTYPE?', $file, '');
362                }
363        }
364
365        if ($ext != 'html') {
366                // validation d'un non squelette
367                $page = array('texte' => $text);
368                $url = url_de_base() . _DIR_RESTREINT_ABS . $file;
369                $script = $file;
370        } else {
371                $script = basename($file, '.html');
372                // pas de validation solitaire pour les squelettes internes, a revoir.
373                if (substr_count($dir, '/') <= 1) {
374                        $url = generer_url_public($script, $contexte);
375                } else {
376                        $url = '';
377                }
378                $composer = charger_fonction('composer', 'public');
379                list($skel_nom, $skel_code) = $composer($text, 'html', 'html', $file);
380
381                spip_log("compilation de $file en " . strlen($skel_code) . " octets de nom $skel_nom");
382                if (!$skel_nom) {
383                        return array('/', '/', $file, '');
384                }
385                $contexte = valider_contexte($skel_code, $file);
386                $page = $skel_nom(array('cache' => ''), array($contexte));
387        }
388        $res = $transformer_xml($page['texte']);
389
390        return array(count($res->err), strlen($res->page), $res->err, $script, $url);
391}
392
393/**
394 * Analyser le code pour construire un contexte plausible complet
395 *
396 * i.e. ce qui est fourni par `$Pile[0]`
397 * en éliminant les exceptions venant surtout des Inclure
398 *
399 * Il faudrait trouver une typologie pour générer un contexte parfait:
400 * actuellement ça produit parfois des erreurs SQL à l'appel de $skel_nom
401 *
402 * @see valider_skel()
403 * @param string $code
404 * @param string $file
405 * @return array
406 */
407function valider_contexte($code, $file) {
408        static $exceptions = array('action', 'doublons', 'lang');
409        preg_match_all('/(\S*)[$]Pile[[]0[]][[].(\w+).[]](\S*)/', $code, $r, PREG_SET_ORDER);
410        $args = array();
411        // evacuer les repetitions et les faux parametres
412        foreach ($r as $v) {
413                list(, $f, $nom, $suite) = $v;
414                if (!in_array($nom, $exceptions)
415                        and (!isset($args[$nom]) or !$args[$nom])
416                ) {
417                        $args[$nom] = ((strpos($f, 'sql_quote') !== false)
418                                and strpos($suite, "'int'") !== false);
419                }
420        }
421        $contexte = array(); // etudier l'ajout de:
422        // 'lang' => $GLOBALS['spip_lang'],
423        // 'date' => date('Y-m-d H:i:s'));
424        foreach ($args as $nom => $f) {
425                if (!$f) {
426                        $val = 'id_article';
427                } else {
428                        // on suppose que arg numerique => primary-key d'une table
429                        // chercher laquelle et prendre un numero existant
430                        $val = 0;
431                        $type = (strpos($nom, 'id_') === 0) ? substr($nom, 3) : $nom;
432                        $trouver_table = charger_fonction('trouver_table', 'base');
433                        $table = $trouver_table(table_objet_sql($type));
434                        if ($table) {
435                                $val = @sql_getfetsel($nom, $table['table'], '', '', '', "0,1");
436                        }
437                        // porte de sortie si ca marche pas,
438                        if (!$val) {
439                                $val = 1;
440                        }
441                }
442                $contexte[$nom] = $val;
443        }
444
445        return $contexte;
446}
447
448/**
449 * Valide la conformité XML d'une liste de fichiers dans un répertoire
450 *
451 * @param array $files
452 *     Liste des fichiers
453 * @param string $ext
454 *     Extension des fichiers
455 * @param string $dir
456 *     Chemin du répertoire
457 * @return array
458 **/
459function valider_dir($files, $ext, $dir) {
460        $res = array();
461        $transformer_xml = charger_fonction('valider', 'xml');
462        $valideur = $ext == 'php' ? 'valider_script' : 'valider_skel';
463        foreach ($files as $f) {
464                spip_timer($f);
465                $val = $valideur($transformer_xml, $f, $dir, $ext);
466                $n = spip_timer($f);
467                $val[] = $n;
468                spip_log("validation de $f en $n secondes");
469                $res[] = $val;
470        }
471
472        return $res;
473}
Note: See TracBrowser for help on using the repository browser.