Changeset 113560 in spip-zone


Ignore:
Timestamp:
Jan 22, 2019, 6:59:03 PM (3 months ago)
Author:
root
Message:

Petit travail collaboratif avec James de nettoyage : on passe à la poubelle les sites dont les urls sont en doublon, en conservant de préférence les sites https.
Un petit génie y travaillera régulièrement.

Location:
_dev_/univers_spip
Files:
1 added
5 edited

Legend:

Unmodified
Added
Removed
  • _dev_/univers_spip/base/univers.php

    r113538 r113560  
    150150                        spip_timer('up');
    151151                        maj_tables(array('spip_websites'));
    152                         sql_update( 'spip_websites', array(
     152                        sql_update('spip_websites', array(
    153153                                'url_clean' =>
    154154                                        "TRIM(LEADING 'www.' FROM " .
     
    157157                                        "TRIM(TRAILING '/' FROM " .
    158158                                        "TRIM(TRAILING 'spip.php' FROM url" .
    159                                         ")))))"
     159                                        ')))))'
    160160                        ));
    161                         echo "Urls cleans calculées en " . spip_timer('up');
     161                        echo 'Urls cleans calculées en ' . spip_timer('up');
    162162                        ecrire_meta($nom_meta_base_version, $current_version = '0.1.10', 'non');
    163163                }
  • _dev_/univers_spip/genie/univers_check.php

    r113298 r113560  
    7474        );
    7575
     76        univers_check_doublons();
     77
    7678        return 0;
    7779}
     80
     81function univers_check_doublons() {
     82        spip_timer('up');
     83        $websites = sql_allfetsel(
     84                ['url_clean', 'count(*) as nb_doublons'],
     85                'spip_websites',
     86                [
     87                        "statut='publie'",
     88                        "status=''",
     89                ],
     90                'url_clean',
     91                '',
     92                '0,50',
     93                'nb_doublons > 1'
     94        );
     95        $websites = array_column($websites, 'url_clean');
     96        foreach ($websites as $website) {
     97                $doublons = sql_allfetsel(
     98                        'id_website',
     99                        'spip_websites',
     100                        ['url_clean = ' . sql_quote($website)],
     101                        '',
     102                        ["IF(LEFT(url, 5) = 'https', 1, 0) DESC", 'date DESC'],
     103                        '1,100'
     104                );
     105                $doublons = array_column($doublons, 'id_website');
     106                sql_updateq(
     107                        'spip_websites',
     108                        ['statut' => 'poub'],
     109                        sql_in('id_website', $doublons)
     110                );
     111        }
     112        echo 'Doublons supprimés en ' . spip_timer('up');
     113}
  • _dev_/univers_spip/inc/univers.php

    r113537 r113560  
    3636        $url_clean = univers_url_clean($base);
    3737
    38         if (
    39                 $id_website = sql_getfetsel('id_website', 'spip_websites', 'url='.sql_quote($base)) or
    40                 $id_website = sql_getfetsel('id_website', 'spip_websites', 'url_clean='.sql_quote($url_clean), '', 'date DESC', '0,1')
     38        if ($id_website = sql_getfetsel('id_website', 'spip_websites', 'url='.sql_quote($base)) or
     39                $id_website = sql_getfetsel(
     40                        'id_website',
     41                        'spip_websites',
     42                        'url_clean='.sql_quote($url_clean), '', 'date DESC', '0,1'
     43                )
    4144        ) {
    4245                return $id_website;
  • _dev_/univers_spip/plugin.xml

    r113537 r113560  
    44        <licence>GPL</licence>
    55        <etat>test</etat>
    6         <version>0.2.29</version>
     6        <version>0.2.30</version>
    77        <version_base>0.1.10</version_base>
    88        <categorie>statistique</categorie>
  • _dev_/univers_spip/univers_pipelines.php

    r112585 r113560  
    1919        $taches_generales['univers_statsv'] = 3*24*3600;
    2020        $taches_generales['univers_check'] = 97;
     21        $taches_generales['univers_check_doublons'] = 12*3600;
    2122
    2223        return $taches_generales;
Note: See TracChangeset for help on using the changeset viewer.