Détecter la langue d'un site en PHP

Fermé
AireMK - 5 févr. 2013 à 11:15
 AireMK - 5 févr. 2013 à 11:35
Bonjour,
Tout d'abord pardonnez moi si mon post est déjà apparu mais je ne trouve pas ma réponse sur internet.
je suis en train de développer un petit outil qui me renvoie une liste d'URL dont j'ai besoin et j'aimerais savoir si il existe une manière assez simple de faire une recherche lexicale de la page pour en déterminer la langue (enfaite je cherche à savoir si il est français, sinon je le défini comme étant en anglais).
Attention :
Je ne veux pas parser le code source pour trouver la balise meta (HTML) ou xml:lang car il me semble que parfois certains développeurs utilisent des structures pré-faites qui ont comme langue défini une autre langue que celle du développeur...
J'ai pensé a plusieurs choses :
retourner le texte brut de la page, faire un explode des 100-200 premiers mots cours (2 ou 3 lettres) et les comparer avec un tableau que j'aurais rempli avec les mots français (le, de, les, une...etc). Tout cela me semble cependant assez lourd et long...
Qu'en pensez vous?
Que me proposeriez vous?
Je suis disponible pour toute question supplémentaires éventuelles.
Merci d'avance pour vos réponses,
Marius

A voir également:

1 réponse

J'ai trouvé ce site http://pear.php.net/package/Text_LanguageDetect.
Il me permetterait d'utiliser la page Text_LanguageDetect qui determine la langue.
N'y aurait-il pas encore plus simple? Car j'ai juste besoin de savoir si le texte est français. Et sinon je le défini en anglais...

Merci d'avance pour vos réponses
0