Changeset 88111 in spip-zone


Ignore:
Timestamp:
Mar 20, 2015, 3:46:41 PM (4 years ago)
Author:
cam.lafit@…
Message:

Traiter des pdf via php c'est plantage une fois sur 2

  • Le principe est de traiter même si c'est imparfait. On capture les erreurs possible sur l'extraction d'une page du pdf
File:
1 edited

Legend:

Unmodified
Added
Removed
  • _plugins_/extraire_documents/trunk/extract/application_pdf.php

    r87938 r88111  
    3434
    3535    // Parcourir les pages et extraire le contenu textuel
    36     foreach ($pdf->getPages() as $page) {
    37         $contenu .= $page->getText();
     36    try {
     37        foreach ($pdf->getPages() as $page) {
     38            $contenu .= $page->getText();
     39        }
     40    }
     41    catch (Exception $e) {
     42        //si on ne peut extraire le texte on passe à la page suivante
     43        $contenu .= "";
    3844    }
    3945
Note: See TracChangeset for help on using the changeset viewer.