Langid: pour détecter un langage

Commençons par une trouvaille qui pourrait être presque classé dans la gamme inutile. Il s’agit d’un service qui détecte la langue d’un texte, d’un url, d’un fichier, d’un mail ou d’un twitt. J’ai testé ça marche relativement bien. J’ai ensuite tapé la phrase « ze ero eoriu aeotoidio uaeo oeit fio » ça m’a donné l’Esperanto.

détecter le langage d'un texte ou d'un siteCommençons par une trouvaille qui pourrait être presque classé dans la gamme inutile.

Langid.net est un service qui détecte la langue d’un texte, d’un url, d’un fichier, d’un mail ou d’un twitt. J’ai testé ça marche relativement bien. J’ai ensuite tapé la phrase « ze ero eoriu aeotoidio uaeo oeit  fio » ça m’a donné l’Esperanto.

je dis que c’est presque inutile, mais peut être que grâce à ce genre de service on peut trouver une perle, un blog intéressant, il faut juste se souvenir que ça existe le jour où on en a besoin.

langid.net

5 réflexions sur « Langid: pour détecter un langage »

  1. Ben, effectivement je me disais bien qu’il devait y avoir un truc de ce genre. Je sais que top de blog utilise ce genre d’API pour éliminer tous les sites qui ne sont pas anglophones. C’est surement très utile pour tous les moteurs de recherche.

  2. Pas complètement inutile puisqu’ils ont mis à disposition une API… ça peut toujours servir 😉

  3. C’est pas mal comme outil mais ça demanderait à se préciser sur les langues les moins utilisées, ou du moins ne pas les confondre avec les langues les plus utilisées.

    Je lui ai écrit du tadjik (langue du tadjikistan dérivé du perse proche de l’iranien, de l’afghan, de l’ouzbek et avec des vrais morceaux de russes dedans), et bien sur 3 phrases il m’a dit 2 fois anglais et 1 fois suédois.

Les commentaires sont fermés.

Pin It on Pinterest

Share This

Share This

Share this post with your friends!