Changeset 54328 in spip-zone


Ignore:
Timestamp:
Nov 11, 2011, 2:29:02 PM (8 years ago)
Author:
arno@…
Message:

Détection du breton

File:
1 edited

Legend:

Unmodified
Added
Removed
 • _plugins_/plugins_seenthis/detecter_langue/inc/detecter_langue.php

  r45146 r54328  
  55$GLOBALS["ngrams"]['az'] = array("lər","in ","ın ","lar","da ","an ","ir ","də ","ki "," bi","ən ","əri","arı","ər ","dir","nda"," ki","rin","nın","əsi","ini"," ed"," qa"," tə"," ba"," ol","ası","ilə","rın"," ya","anı"," və","ndə","ni ","ara","ını","ınd"," bu","si ","ib ","aq ","dən","iya","nə ","rə ","n b","sın","və ","iri","lə ","nin","əli"," de"," mü","bir","n s","ri ","ək "," az"," sə","ar ","bil","zər","bu ","dan","edi","ind","man","un ","ərə"," ha","lan","yyə","iyy"," il"," ne","r k","ə b"," is","na ","nun","ır "," da"," hə","a b","inə","sin","yan","ərb"," də"," mə"," qə","dır","li ","ola","rba","azə","can","lı ","nla"," et"," gö","alı","ayc","bay","eft","ist","n i","nef","tlə","yca","yət","əcə"," la","ild","nı ","tin","ldi","lik","n h","n m","oyu","raq","ya ","əti"," ar","ada","edə","mas","sı ","ına","ə d","ələ","ayı","iyi","lma","mək","n d","ti ","yin","yun","ət ","azı","ft ","i t","lli","n a","ra "," cə"," gə"," ko"," nə"," oy","a d","ana","cək","eyi","ilm","irl","lay","liy","lub","n ə","ril","rlə","unu","ver","ün ","ə o","əni"," he"," ma"," on"," pa","ala","dey","i m","ima","lmə","mət","par","yə ","ətl"," al"," mi"," sa"," əl","adı","akı","and","ard","art","ayi","i a","i q","i y","ili","ill","isə","n o","n q","olu","rla","stə","sə ","tan","tel","yar","ədə"," me"," rə"," ve"," ye","a k","at ","baş","diy","ent","eti","həs","i i","ik ","la ","miş","n n","nu ","qar","ran","tər","xan","ə a","ə g","ə t"," dü","ama","b k","dil","era","etm","i b","kil","mil","n r","qla","r s","ras","siy","son","tim","yer","ə k"," gü"," so"," sö"," te"," xa","ai ","bar","cti","di ","eri","gör","gün","gəl","hbə","ihə","iki","isi","lin","mai","maq","n k","n t","n v","onu","qan","qəz","tə ","xal","yib","yih","zet","zır","ıb ","ə m","əze"," br"," in"," i̇r"," pr"," ta"," to"," üç","a o","ali","ani","anl","aql","azi","bri");
  66$GLOBALS["ngrams"]['bg'] = array("на "," на","то "," пр"," за","та "," по","ите","те ","а п","а с"," от","за ","ата","ия "," в ","е н"," да","а н"," се"," ко","да ","от ","ани","пре","не ","ени","о н","ни ","се "," и ","но ","ане","ето","а в","ва ","ван","е п","а о","ото","ран","ат ","ред"," не","а д","и п"," до","про"," съ","ли ","при","ния","ски","тел","а и","по ","ри "," е "," ка","ира","кат","ние","нит","е з","и с","о с","ост","че "," ра","ист","о п"," из"," са","е д","ини","ки ","мин"," ми","а б","ава","е в","ие ","пол","ств","т н"," въ"," ст"," то","аза","е о","ов ","ст ","ът ","и н","ият","нат","ра "," бъ"," че","алн","е с","ен ","ест","и д","лен","нис","о о","ови"," об"," сл","а р","ато","кон","нос","ров","ще "," ре"," с "," сп","ват","еше","и в","иет","о в","ове","ста","а к","а т","дат","ент","ка ","лед","нет","ори","стр","стъ","ти ","тър"," те","а з","а м","ад ","ана","ено","и о","ина","ити","ма ","ска","сле","тво","тер","ция","ят "," бе"," де"," па","ате","вен","ви ","вит","и з","и и","нар","нов","ова","пов","рез","рит","са ","ята"," го"," ще","али","в п","гра","е и","еди","ели","или","каз","кит","лно","мен","оли","раз"," ве"," гр"," им"," ме"," пъ","ави","ако","ача","вин","во ","гов","дан","ди ","до ","ед ","ери","еро","жда","ито","ков","кол","лни","мер","нач","о з","ола","он ","она","пра","рав","рем","сия","сти","т п","тан","ха ","ше ","шен","ълг"," ба"," си","аро","бъл","в р","гар","е е","елн","еме","ико","има","ко ","кои","ла ","лга","о д","ози","оит","под","рес","рие","сто","т к","т м","т с","уст"," би"," дв"," дъ"," ма"," мо"," ни"," ос","ала","анс","ара","ати","аци","беш","вър","е р","едв","ема","жав","и к","иал","ица","иче","кия","лит","о б","ово","оди","ока","пос","род","сед","слу","т и","тов","ува","циа","чес","я з"," во"," ил"," ск"," тр"," це","ами","ари","бат","би ","бра","бъд");
   7$GLOBALS["ngrams"]['br'] = array("ar "," a ","en ","an ","et "," ar","ez "," he"," ha"," an","n d"," ho"," da"," va"," eu","ur ","er "," pe"," de","nt "," ma","n e","var"," en"," be"," di"," ch"," e ","eur","ou ","uz ","it ","ho ","z a","he ","da ","a z","n a"," do","oue","ha ","n h"," ne","dou","t a"," ke"," ev","un ","ag ","t e","euz"," me"," ga"," : ","ant"," zo","ll ","ad ","ch ","oun","t h"," la","t d","r a","a d"," ve","r b","ed ","enn","hag"," re","ue ","zo ","a v","ra ","r p","ma "," go","r g","el ","cho","evi","a g","a r","hen","vez","deu","aou","c'h","eo ","z e","ent","z h","che","a b","vit","vel"," dr","eme","eve","r m","our","mp ","e a"," ra"," ka"," pa","omp","han","eun","den","ne ","r h","rou","a e","ist"," gu","d a","o d","uez","gan","az "," tr"," eo","e d","och","ell","e v","or ","va ","on "," br","r v","ro ","ket","ava","all","gou","o e","g a","re ","ude","e e","oud"," se"," ko","z d","eze","tra","lav","e h","kou","oul"," al","r e","lou","ken"," ze","iou","are","ud "," gr","u a","hou","ach","n t"," na","mar","r c","a l","ret","zou"," er","l a","mad","nn ","a c","ze ","oll","a h","r d","l e","ris","e g","per","eza","mez","a n","ech","oua","st ","ont","bed","at "," zi","t m","iz ","za ","bre","d e","o a","o k","hor","d h","rn ","a m","em ","ene"," c'","etr","e k","ara","in "," et","gue","t g","us "," em","e z","t k","cha","na ","ouz","as ","nte","ut "," ou"," ta"," le","ere","red"," ba"," sa","g e","rez","a k","nan"," sk","e m","rei"," te","t p","dre","ele","men","ran","o h","e c","e b","her","tro"," dh","ber","ste","o p","reu"," za","ui ","bar","hon","n n","out","spe","dis","alo","uel","a a","hol","ver","ezo","bez","hoa","i a","tre","ank","gal","kri","bet","ni ","dig","al ","a p","una","r s","env","net","ave","ten"," kr","rea","e p"," hi","tez","ta ","l d","u d","eud","r z","r r","ren");
  78$GLOBALS["ngrams"]['ca'] = array(" de","es ","de ","la "," la","el ","que"," el"," co","ent","s d"," qu"," i ","en ","er "," a ","ls ","nt "," pe","e l","a d"," en","per","ci ","ar ","ue ","al "," se","est","at "," es","ts "," s "," pr","aci"," un","res","men","s e","del","s a","s p"," re","les"," l'","na ","a l"," ca"," d'","els","a p","ia ","ns ","con"," le","tat","a c","i d","a a","ra ","a e"," no","ant"," al","t d","s i"," di","ta ","re ","a s","com","s c","ita","ons","sta","ica"," po","r a"," in","pro","tre"," pa","ues","amb","ion","des","un "," ma","da ","s s","a i","an ","mb "," am","l d","e d","va ","pre","ter","e e","e c","a m","cia","una","i e","nci","tra"," te","ona","os ","t e","n e","l c","ca ","cio","l p"," tr","par","r l","t a","e p","aqu","nta"," so","ame","era","r e","e s","ada","n a","s q"," si"," ha","als","tes"," va"," m ","ici","nte","s l","s m","i a","or "," mo","ist","ect","lit","m s"," to","ir ","a t","esp","ran","str","om ","l s","st ","nts"," me","no ","r d","d'a","l'a","ats","ria","s t"," ta","sen","rs ","eix","tar","s n","n l","tal","e a","t p","art"," mi"," ll","tic","ten","ser"," aq","ina","ntr","a f","sti","ol ","a q","for","ura","ers","ari","int","act","l'e"," fi","r s","e t","tor","si ","ste","rec","a r"," fe","is ","em ","n d","car","bre"," fo"," vi"," an","ali","i p","ix ","ell","l m","pos","orm","l l","i l"," ac","fer","s r","ess","eu ","e m","ens","ara","eri","sa ","ssi","us ","ort","tot","ll ","por","ora"," ci","tan","ass","n c","ost","nes","rac","a u","ver","ont","ha "," ti","itz","gra","t c"," n ","a v","ren","cat","nal"," ri","qua","t l"," do","t s","rma","ual","i s","s f","n p","s v","te ","t i"," ba","cte","tam","man","l t","ial"," fa","ic "," ve","ble","a n","all","tza","ies"," s'","le ","omp","r c"," nc","rti","it ","rre","fic","any","on "," sa","r p","tur");
  89$GLOBALS["ngrams"]['ceb'] = array("ng ","sa "," sa","ang","ga ","nga"," ka"," ng","an "," an"," na"," ma"," ni","a s","a n","on "," pa"," si","a k","a m"," ba","ong","a i","ila"," mg","mga","a p","iya","a a","ay ","ka ","ala","ing","g m","n s","g n","lan"," gi","na ","ni ","o s","g p","n n"," da","ag ","pag","g s","yan","ayo","o n","si "," mo","a b","g a","ail","g b","han","a d","asu","nag","ya ","man","ne ","pan","kon"," il"," la","aka","ako","ana","bas","ko ","od ","yo "," di"," ko"," ug","a u","g k","kan","la ","len","sur","ug "," ai","apa","aw ","d s","g d","g g","ile","nin"," iy"," su","ene","og ","ot ","aba","aha","as ","imo"," ki","a t","aga","ban","ero","nan","o k","ran","ron","sil","una","usa"," us","a g","ahi","ani","er ","ha ","i a","rer","yon"," pu","ini","nak","ro ","to ","ure"," ed"," og"," wa","ili","mo ","n a","nd ","o a"," ad"," du"," pr","aro","i s","ma ","n m","ulo","und"," ta","ara","asa","ato","awa","dmu","e n","edm","ina","mak","mun","niy","san","wa "," tu"," un","a l","bay","iga","ika","ita","kin","lis","may","os "," ar","ad ","ali","ama","ers","ipa","isa","mao","nim","t s","tin"," ak"," ap"," hi","abo","agp","ano","ata","g i","gan","gka","gpa","i m","iha","k s","law","or ","rs ","siy","tag"," al"," at"," ha"," hu"," im","a h","bu ","e s","gma","kas","lag","mon","nah","ngo","r s","ra ","sab","sam","sul","uba","uha"," lo"," re","ada","aki","aya","bah","ce ","d n","lab","pa ","pak","s n","s s","tan","taw","te ","uma","ura"," in"," lu","a c","abi","at ","awo","bat","dal","dla","ele","g t","g u","gay","go ","hab","hin","i e","i n","kab","kap","lay","lin","nil","pam","pas","pro","pul","ta ","ton","uga","ugm","unt"," co"," gu"," mi"," pi"," ti","a o","abu","adl","ado","agh","agk","ao ","art","bal","cit","di ","dto","dun","ent","g e","gon","gug","ia ","iba","ice","in ","inu","it ","kaa");
   
  137138        if (tester_plage_utf($texte, "[\x{0041}-\x{024F}\x{1E00}-\x{1EFF}]") < 0.5) {
  138139                // Latin
  139                 return array("fr", "en", "de", "it", "es", 'af',"ca",'ceb',"da","fi","nl","nr","pt","pt_BR","pt_PT","sk","ha","haw","hr","pl","cs","az","cy","et","ro","eu","hu","id","is","la","lt","lv","nb","nso","sl","so","sq","ss","st","sv","sw","tl","tlh","tn","tr","ts","ve","xh","zu");
   140                return array("fr", "en", "de", "it", "es", 'af','br','ca','ceb',"da","fi","nl","nr","pt","pt_BR","pt_PT","sk","ha","haw","hr","pl","cs","az","cy","et","ro","eu","hu","id","is","la","lt","lv","nb","nso","sl","so","sq","ss","st","sv","sw","tl","tlh","tn","tr","ts","ve","xh","zu");
  140141        } else if (tester_plage_utf($texte, "[\x{0400}-\x{0523}]") < 0.5) {
  141142                // Cyrillique
Note: See TracChangeset for help on using the changeset viewer.