Changeset 57251 in spip-zone


Ignore:
Timestamp:
Jan 17, 2012, 6:52:31 AM (8 years ago)
Author:
denisb@…
Message:

nospam : améliorations des regexp de détection des éléments html pouvant servir à masquer du contenu. on note désormais comme spam tout message comportant des clauses style= ou class=

Location:
_plugins_/nospam
Files:
2 edited

Legend:

Unmodified
Added
Removed
  • _plugins_/nospam/inc/nospam.php

    r57157 r57251  
    125125        $infos['nombre_liens'] = count($liens);
    126126
    127         // repérer le contenu caché par des ruses html
    128         $hidden = "@\<.*style.*(display|position|overflow|visibility|height)\s*:.*>@i";
    129         // ne pas analyser les extraits de code
    130         $texte_humain = preg_replace('@<(?:code|pre).*>[^<]*</(?:code|pre)>@', '', $texte);
     127        // on ne tient pas compte des blocs <code> et <cadre> ni de leurs contenus
     128        $texte_humain = preg_replace(',<(code|cadre)\s*[^>]*>.*</\1>,UimsS', ' ', $texte);
     129        // on repère dans ce qui reste la présence de style= ou class= qui peuvent
     130        // servir à masquer du contenu
     131        $hidden = ",\s(?:style|class)=[^>]+>,UimsS";
    131132        if (preg_match($hidden,$texte_humain))
     133                // suspicion de spam
    132134                $infos['contenu_cache'] = true;
    133135
  • _plugins_/nospam/plugin.xml

    r57157 r57251  
    1010        <icon>images/nospam-32.png</icon>
    1111        <licence>(c) 2008 GPL</licence>
    12         <version>0.8.7</version>
     12        <version>0.8.8</version>
    1313        <etat>stable</etat>
    1414        <description><multi>
Note: See TracChangeset for help on using the changeset viewer.