Changeset 110766 in spip-zone


Ignore:
Timestamp:
Jun 20, 2018, 10:07:51 AM (3 years ago)
Author:
cedric@…
Message:

fonction generique de controle de la memoire disponible et appel au cas par cas depuis les differents parseurs en fonction de leur techno/fonctionnement/mime-type etc

Location:
_plugins_/extraire_documents/trunk
Files:
1 added
3 edited

Legend:

Unmodified
Added
Removed
  • _plugins_/extraire_documents/trunk/extraire/defaut/10_tika_server.php

    r110657 r110766  
    5454        // On récupère le client pour discuter avec Tika
    5555        $client = \Vaites\ApacheTika\Client::make($url_serveur, $port);
     56
     57        // verifier la memoire disponible : on a besoin de 3 fois la taille du fichier (estimation)
     58        // TODO : verifier cette estimation pour ce parser
     59        include_spip('inc/extrairedoc');
     60        if (!extrairedoc_verifier_memoire_disponible(3 * filesize($fichier))) {
     61                return '';
     62        }
    5663       
    5764        // On tente de récupérer le texte brut du fichier
  • _plugins_/extraire_documents/trunk/extraire/fallback/application_pdf/90_pdfparser.php

    r110744 r110766  
    3939
    4040        $parser = new \Smalot\PdfParser\Parser();
     41
     42        // verifier la memoire disponible : on a besoin de 3 fois la taille du fichier (estimation)
     43        // TODO : verifier cette estimation pour ce parser
     44        include_spip('inc/extrairedoc');
     45        if (!extrairedoc_verifier_memoire_disponible(3 * filesize($fichier))) {
     46                return '';
     47        }
     48
    4149        //Tenter de lire le pdf
    4250        try {
  • _plugins_/extraire_documents/trunk/extraire/fallback/application_pdf/99_pdfexec.php

    r110665 r110766  
    5050                $nouveaufichier = str_replace('.pdf', '.txt', $fichier);
    5151                if (file_exists($nouveaufichier) && is_readable($nouveaufichier)) {
     52
     53                        // verifier la memoire disponible : on a besoin de 2 fois la taille du fichier texte (estimation)
     54                        include_spip('inc/extrairedoc');
     55                        if (!extrairedoc_verifier_memoire_disponible(2 * filesize($nouveaufichier))) {
     56                                return '';
     57                        }
     58
    5259                        $contenu = file_get_contents($nouveaufichier);
    5360                        // TODO : comment connaitre l'encoding du fichier ?
Note: See TracChangeset for help on using the changeset viewer.