source: spip-zone/_plugins_/indexer/trunk/doc/Configuration Sphinx.md

Last change on this file was 100548, checked in by cedric@…, 2 years ago

completer la doc

File size: 2.3 KB
Line 
1# Configuration de Sphinx pour l'index
2
3```
4
5index spip {
6        type = rt
7        path = /var/lib/sphinxsearch/data/spip
8
9        rt_field              = title
10        rt_attr_string        = title
11
12        rt_field              = summary
13        rt_attr_string        = summary
14
15        rt_field              = content
16        rt_attr_string        = content
17
18        rt_attr_timestamp     = date
19        rt_attr_timestamp     = date_indexation
20        rt_attr_string        = uri
21
22        rt_attr_json          = properties
23
24        rt_attr_string        = signature
25
26        dict = keywords
27
28        morphology = stem_en, libstemmer_fr
29
30        <?php
31                echo _CHARSET_INDEXATION_FR ;
32        ?>
33}
34
35```
36
37
38
39# stopwords
40
41Dans certains cas on peut vouloir employer un fichier de stopwords (http://sphinxsearch.com/docs/current.html#conf-stopwords) configuré depuis le SPIP.
42
43Côté SPIP, le plugin Indexer offre la possibilité de définir cette liste en séparant les mots par des virgules, par exemple:
44>  au, aux, avec, ce, ces, dans, de, des, du, elle, en, et, eux, il, je, la, le, leur, lui, ma, mais, me, même, mes, moi, mon, ne, nos, notre, nous, on, ou, par, pas, pour, qu, que, qui, sa, se, ses, son, sur, ta, te, tes, toi, ton, tu, un, une, vos, votre, vous, c, d, j, l, à, m, n, s, t, y, été, étée, étées, étés, étant, étante, étants, étantes, suis, es, est, sommes, êtes, sont, serai, seras, sera, serons, serez, seront, serais, serait, serions, seriez, seraient, étais, était, étions, étiez, étaient, fus, fut, fûmes, fûtes, furent, sois, soit, soyons, soyez, soient, fusse, fusses, fût, fussions, fussiez, fussent, ayant, ayante, ayantes, ayants, eu, eue, eues, eus, ai, as, avons, avez, ont, aurai, auras, aura, aurons, aurez, auront, aurais, aurait, aurions, auriez, auraient, avais, avait, avions, aviez, avaient, eut, eûmes, eûtes, eurent, aie, aies, ait, ayons, ayez, aient, eusse, eusses, eût, eussions, eussiez, eussent
45
46Cette config est exposée à l’adresse
47spip.php?page=indexer-config-stopwords.json
48sous forme d’une liste texte des mots, en minuscules et sans accents.
49
50On peut importer cette configuration dans la configuration de Sphinx:
51```
52$stopfile = '/var/lib/sphinxsearch/data/spip-stopwords.txt';
53$stopwords = @json_decode(file_get_contents('[URL]/spip.php?page=indexer-config-stopwords.json'), true);
54if (is_array($stopwords)) {
55        ($fp = fopen($stopfile, 'w'))
56  && fwrite($fp, join("\n", $stopwords))
57  && fclose($fp);
58}
59echo "stopwords = $stopfile\n";
60```
61
62
Note: See TracBrowser for help on using the repository browser.