Changeset 93444 in spip-zone


Ignore:
Timestamp:
Dec 8, 2015, 10:55:18 AM (5 years ago)
Author:
fil@…
Message:

fichier d'export de la config des stopwords + documentation

Location:
_plugins_/indexer/trunk
Files:
1 added
1 edited

Legend:

Unmodified
Added
Removed
  • _plugins_/indexer/trunk/doc/Configuration Sphinx.md

    r92134 r93444  
    3030
    3131```
     32
     33
     34
     35# stopwords
     36
     37Dans certains cas on peut vouloir employer un fichier de stopwords (http://sphinxsearch.com/docs/current.html#conf-stopwords) configuré depuis le SPIP.
     38
     39Côté SPIP, le plugin Indexer offre la possibilité de définir cette liste en séparant les mots par des virgules, par exemple:
     40>  au, aux, avec, ce, ces, dans, de, des, du, elle, en, et, eux, il, je, la, le, leur, lui, ma, mais, me, même, mes, moi, mon, ne, nos, notre, nous, on, ou, par, pas, pour, qu, que, qui, sa, se, ses, son, sur, ta, te, tes, toi, ton, tu, un, une, vos, votre, vous, c, d, j, l, à, m, n, s, t, y, été, étée, étées, étés, étant, étante, étants, étantes, suis, es, est, sommes, êtes, sont, serai, seras, sera, serons, serez, seront, serais, serait, serions, seriez, seraient, étais, était, étions, étiez, étaient, fus, fut, fûmes, fûtes, furent, sois, soit, soyons, soyez, soient, fusse, fusses, fût, fussions, fussiez, fussent, ayant, ayante, ayantes, ayants, eu, eue, eues, eus, ai, as, avons, avez, ont, aurai, auras, aura, aurons, aurez, auront, aurais, aurait, aurions, auriez, auraient, avais, avait, avions, aviez, avaient, eut, eûmes, eûtes, eurent, aie, aies, ait, ayons, ayez, aient, eusse, eusses, eût, eussions, eussiez, eussent
     41
     42Cette config est exposée à l’adresse
     43spip.php?page=indexer-config-stopwords.json
     44sous forme d’une liste texte des mots, en minuscules et sans accents.
     45
     46On peut importer cette configuration dans la configuration de Sphinx:
     47```
     48$stopfile = '/var/local/sphinx/data/index-stopwords.txt';
     49$stopwords = @json_decode(file_get_contents('[URL]/spip.php?page=indexer-config-stopwords.json'), true);
     50if (is_array($stopwords)) {
     51        ($fp = fopen($stopfile, 'w))
     52  && fwrite($fp, join("\n", $stopwords)
     53  && fclose($fp);
     54}
     55echo "stopwords = $stopfile\n";
     56```
     57
     58
Note: See TracChangeset for help on using the changeset viewer.