Changeset 94441 in spip-zone


Ignore:
Timestamp:
Jan 4, 2016, 11:26:55 PM (4 years ago)
Author:
rastapopoulos@…
Message:

On utilise le nouveau drapeau de suppresion pour ajouter une nouvelle option (en surchargeant le squelette de config de "document") pour sélectionner les types (les extensions) qu'on veut indexer : si ya rien on indexe tout, si ya au moins une sélection on indexe que ce qui est choisi. Ce qui permet d'indexer juste les PDF, ODT, Word, etc, par exemple, sans les images.

Location:
_plugins_/indexer-documents/trunk
Files:
5 added
2 edited

Legend:

Unmodified
Added
Removed
  • _plugins_/indexer-documents/trunk/indexerdoc_pipelines.php

    r91696 r94441  
    11<?php
     2include_spip('inc/config');
    23
    34/**
     
    1314                $extraire = array('contenu' => false);
    1415               
    15         // Extraire le contenu si possible
    16         if (defined('_DIR_PLUGIN_EXTRAIREDOC')) {
    17             include_spip('inc/extraire_document');
    18             $extraire = inc_extraire_document($flux['args']['champs']);
    19         }
    20        
    21         // Si le document n'avait pas de titre, on met le nom du fichier
    22                 if (empty($document->title)) {
    23                         $document->title = $flux['args']['champs']['fichier'];
     16                // On teste les types de document :
     17                // s'il y a des types précis configurés et que ce doc n'en fait PAS partie, on supprime
     18                if (
     19                        isset($flux['args']['champs']['extension'])
     20                        and $types = lire_config('indexer/document/types_acceptes')
     21                        and !empty($types)
     22                        and !in_array($flux['args']['champs']['extension'], $types)
     23                ) {
     24                        $document->to_delete = true;
    2425                }
    25                
    26                 // Si on a réussi à extraire le document, on ajoute son contenu
    27                 if ($extraire['contenu']) {
    28                         $document->content .= "\n\n" . $extraire['contenu'];
     26                // Sinon on essaye d'extraire le contenu du fichier
     27                else {
     28                        // Extraire le contenu si possible
     29                        if (defined('_DIR_PLUGIN_EXTRAIREDOC')) {
     30                                include_spip('inc/extraire_document');
     31                                $extraire = inc_extraire_document($flux['args']['champs']);
     32                        }
     33                       
     34                        // Si le document n'avait pas de titre, on met le nom du fichier
     35                        if (empty($document->title)) {
     36                                $document->title = $flux['args']['champs']['fichier'];
     37                        }
     38                       
     39                        // Si on a réussi à extraire le document, on ajoute son contenu
     40                        if ($extraire['contenu']) {
     41                                $document->content .= "\n\n" . $extraire['contenu'];
     42                        }
    2943                }
    3044        }
  • _plugins_/indexer-documents/trunk/paquet.xml

    r91696 r94441  
    22    prefix="indexerdoc"
    33    categorie="navigation"
    4     version="1.0.1"
     4    version="1.2.0"
    55    etat="test"
    66    compatibilite="[3.0.0;3.1.*]"
Note: See TracChangeset for help on using the changeset viewer.