L'ennuie de voir tout le monde content qu'il y a enfin un plugin pour filtrer par langues sur Mastodon mais qu'en fait, pour marcher, ça balance tous les toots à google translate :/
@bram une idée comme ça mais c'est peut-être difficilement réalisable (je me rends pas compte je suis pas dév), est-ce qu'il y aurait pas moyen de gérer ça directement depuis les paramètres du compte en choisissant une ou plusieurs langues dans un "tableau de bord" qui permettrait d'afficher sur les fils locaux/globaux uniquement les pouets de ceux qui ont sélectionné l'une des langues qu'on a soi-même choisies ?
@Fiwou si, je crois que c'est quelque chose du genre qui sera fait, la difficulté est plus sur la détection de la langue je pense (après j'ai pas foutu le nez dedans)
@bram https://github.com/saffsd/langid.py est pas mal mais c'est du python
@liluvou pas d'bole, mastodon est en ruby :p
@bram Il y a aussi du node, donc quite à faire un joyeux mélange, autant y aller à fond
@liluvou le node est pertinent, c'est des workers sur le côté, donc c'est d'autres processus, la base de code est pas partagé (après ça aurait été mieux en full ruby mais bon)
@bram @liluvou Du coup l'API que j'utilise est en NodeJS aussi, il faudrait que je fork mastodon pour voir si je peux faire quelque chose..
@arthak @bram Bah il y a pas de raison, si elle fonctionne bien (en dehors de l’arnaque sur les petites chaînes)

Et en fait c'est déjà plus d'actualité, le développeur vient de sortir une version qui utilise plus google translate ! https://mastodon.social/users/arthak/updates/1953224

Tout va bien qui fini bien :)

cc @arthak

@bram La timeline globale je trouvais ça géniale : on découvrait de nouveaux gens, nouvelles idées. Mais ça c'était avant. Maintenant je ne comprends plus rien. Mais c'est joli tous ces idéogrammes japonais.

Du coup j'me demande si filtrer par caractères/idéogrammes serait pas utile plutôt, si possible : si le toot ne contient que des caractères japonais ou du cyrillique, j'aimerais pouvoir le filtrer.

@nicofrand d'un point de vue technique c'est pas ultra compliqué à faire de manière isolé, maintenant intégrer ça dans mastodon c'est autre chose.

Idéalement en fait il faudrait faire un petit peu de machine learning à coup de filtre bayesiens ou autres déjà pre-entrainé, mais comme chaque fois, yakafokon.

@bram Ouais. C'était + pour exposer l'idée de filtrer sur caractères/idéogrammes que sur une langue définie (ça filtrera pas le portugais que je ne comprends pas non plus mais au moins pas besoin d'un service externe).
@bram Les gens n'ont toujours pas compris pourquoi Google est gratuit, semblerait-il...
@bram Utiliser Google translate, l'identification via Facebook sur Mastodon... Y'a pas comme une c... dans le potage ??
Je propose un tag analytics aussi