Ignore:
Timestamp:
Jun 18, 2018, 4:14:04 PM (3 years ago)
Author:
cedric@…
Message:

indentation

File:
1 edited

Legend:

Unmodified
Added
Removed
  • _plugins_/extraire_documents/trunk/extraire/fallback/application_pdf/90_pdfparser.php

    r110743 r110744  
    44 * Tester si cette méthode d'extraction est disponible
    55 **/
    6 function extraire_fallback_application_pdf_90_pdfparser_test_dist() {
     6function extraire_fallback_application_pdf_90_pdfparser_test_dist(){
    77        if (
    88                find_in_path('lib/TCPDF-6.2.17')
    99                and find_in_path('lib/pdfparser-0.12.0/src')
    10         ) {
     10        ){
    1111                return true;
    12         }
    13         else {
     12        } else {
    1413                return false;
    1514        }
     
    2322 * @return Scontenu le contenu brut
    2423 **/
    25 function extraire_fallback_application_pdf_90_pdfparser_extraire_dist($fichier) {
    26     $infos = array('contenu' => false);
    27     $contenu = '';
     24function extraire_fallback_application_pdf_90_pdfparser_extraire_dist($fichier){
     25        $infos = array('contenu' => false);
     26        $contenu = '';
    2827
    29     // Bespoin de charger composer
    30     if (!class_exists('Composer\\Autoload\\ClassLoader')) {
     28        // Bespoin de charger composer
     29        if (!class_exists('Composer\\Autoload\\ClassLoader')){
    3130                include_spip('lib/Composer/Autoload/ClassLoader');
    3231        }
    33     include_spip('lib/TCPDF-6.2.17/tcpdf_parser');
     32        include_spip('lib/TCPDF-6.2.17/tcpdf_parser');
    3433
    35     $loader = new \Composer\Autoload\ClassLoader();
     34        $loader = new \Composer\Autoload\ClassLoader();
    3635
    37     // register classes with namespaces
    38     $loader->add('Smalot\PdfParser', find_in_path('lib/pdfparser-0.12.0/src'));
    39     $loader->register();
     36        // register classes with namespaces
     37        $loader->add('Smalot\PdfParser', find_in_path('lib/pdfparser-0.12.0/src'));
     38        $loader->register();
    4039
    41     $parser = new \Smalot\PdfParser\Parser();
    42     //Tenter de lire le pdf
    43     try {
    44         set_time_limit (0);
    45         $pdf = $parser->parseFile($fichier);
    46     }
    47     catch (Exception $e) {
    48         //Pour toute exception on s'arrete et on retourne un contenu vide
    49         //Les cas de figure sont entre autre les fichiers mal formés ou signés
    50         return '';
    51     }
     40        $parser = new \Smalot\PdfParser\Parser();
     41        //Tenter de lire le pdf
     42        try {
     43                set_time_limit(0);
     44                $pdf = $parser->parseFile($fichier);
     45        } catch (Exception $e) {
     46                //Pour toute exception on s'arrete et on retourne un contenu vide
     47                //Les cas de figure sont entre autre les fichiers mal formés ou signés
     48                return '';
     49        }
    5250
    53     // Parcourir les pages et extraire le contenu textuel
    54     try {
    55         foreach ($pdf->getPages() as $page) {
    56             $contenu .= $page->getText();
    57         }
    58     }
    59     catch (Exception $e) {
    60         //si on ne peut extraire le texte on passe à la page suivante
    61         $contenu .= '';
    62     }
     51        // Parcourir les pages et extraire le contenu textuel
     52        try {
     53                foreach ($pdf->getPages() as $page){
     54                        $contenu .= $page->getText();
     55                }
     56        } catch (Exception $e) {
     57                //si on ne peut extraire le texte on passe à la page suivante
     58                $contenu .= '';
     59        }
    6360
    64     //Libérer les ressources
    65     unset($parser);
    66     unset($loader);
    67        
     61        //Libérer les ressources
     62        unset($parser);
     63        unset($loader);
     64
    6865        // Si on a trouvé du texte
    69         if ($contenu) {
     66        if ($contenu){
    7067                $infos['contenu'] = $contenu;
    7168        }
    72        
    73     return $infos;
     69
     70        return $infos;
    7471}
Note: See TracChangeset for help on using the changeset viewer.