Pour le coup, la shitstorm sur #VLC qui ajoute de « l’IA » m’a l’air complètement hors sol et du gros emballement, et ça m’énerve un peu car j’ai l’impression que c’est encore du validisme derrière. 😬

Pour résumer, VLC va ajouter une fonction optionnelle pour des « sous-titrages » par IA pour les vidéos qui n’en ont pas.
L’auteur explique que c’est pas juste pour le plaisir de mettre de l’IA partout hein, mais un outil d’accessibilité optionnel pour tenter de rendre un tout petit peu accessibles les (trop nombreuses) vidéos qui n’ont pas de sous-titres. Tout en précisant qu’à l’évidence ce serait mieux d’avoir des vrais sous-titres professionnels faits par des humains (que VLC continuera d’afficher quand ils existent, évidemment).

Cf https://beige.party/@bedast/113799126497343123

Alors OK, c’est de « l’IA », mais ça me paraît être un des rares usages « justifiés » et utiles de l’IA, pour le coup, et je pense qu’on est ici dans une réaction épidermique et dépolitisée, parce qu’ici il y a à peu près aucun des nombreux inconvénients de « l’IA » qu’on voit habituellement.

Le seul « argument » que j’ai lu contre cette utilisation spécifique dans VLC, c’est l’impact environnemental, comme quoi l’IA ça « gaspillerait » des cycles CPU/GPU, et donc des ressources naturelles, de l’eau pour le refroidissement des serveurs et tout, etc. bref vous connaissez l’impact environnemental dramatique en général des data centers.
Sauf que là c’est justement pas le cas.

Quand c’est pour produire des résultats de recherche trompeurs et dangereux sur Google ou autre, oui c’est du gaspillage, parce que ça n’apporte absolument rien à personne (au contraire), et ça a un impact à grande échelle terrible parce que c’est imposé à des millions de gens (qui n’en veulent pas en plus) pour produire rien d’utile.

Mais sauf que dans le cas de VLC, d’une part l’impact total du truc sur l’environnement sera absolument négligeable, parce que seule une infime partie des gens qui utilisent VLC utiliseront cette fonctionnalité.

Mais en plus et surtout, pour le coup on parle d’une utilisation justifiée de l’IA, qui pourrait permettre à des gens de profiter de vidéos auxquelles sinon iels ne pourraient pas accéder ! C’est pas du « gaspillage », parce que ça produit quelque chose de vraiment utile, ça sert à des gens !

Je vous ferais remarquer que quand on joue à des jeux vidéos, ou même quand on regarde une vidéo, ça utilise des cycles CPU/GPU aussi en fait !
Probablement plus que la fonctionnalité de sous-titrage en fait, parce que pour rappel, rien que pour une vidéo basique en FHD, il faut décoder des vidéos compressées en 24+ images/seconde qui font chacune 1920*1080 = 2.07 millions de pixels hein. Avec trois composantes par pixel.
Je vous laisse calculer le nombre de cycles que ça fait tout ça.
Et les jeux j’en parle même pas parce que la consommation en énergie doit être encore pire.

Et pourtant on dit pas que ce serait du « gaspillage » tout ça, parce que ça nous procure un plaisir et qu’on considère que ce plaisir justifie cette utilisation et cette dépense de ressources. Sinon ce serait facile d’arrêter pour protéger la planète hein, mais personne le propose, bizarrement. On peut aussi aller vivre en forêt pour réduire notre impact environnemental.

Par contre, une fonctionnalité qui pourrait permettre aux sourd·e·s et aux malentendant·e·s de profiter elleux aussi des mêmes choses que nous, pour un coût en ressources dérisoire en pratique, ben non, surtout pas, là ça devient d’un coup du « gaspillage » hein, et hop c’est la levée de boucliers partout. 😬

Vraiment à un moment il faudrait prendre un peu de recul. 😬

bedast (@[email protected])

The enshittification of AI has lead to the choice of AI used by VLC to be groaned at. I even saw a post cross my feed of someone looking for a replacement for VLC. VLC is working on on-device realtime captioning. This has nothing to do with generating images or video using AI. This has nothing to do with LLMs. This is not generative AI. While it would be preferred to use human generated captions for better accuracy, this is not always possible. This means a lot of video media is inaccessible to those with hearing impairment. What VLC is doing is something that will contribute to accessibility in a big way. AI transcription is still not perfect. It has its problems. But this is one of those things that we should be hoping to advance. I'm not looking to replace humans in creating captions. I think we're very far from ever being able to do this correctly without humans. But as I said, there's a ton of video content that simply do not have captions available, human generated or not. So long as they're not trying to manipulate the transcription using GenAI means, this is the wrong one to demonize. #AI #Transcription #VLC #HearingImpaired #Deaf #Accessibility

beige.party
@jor
Merci pour ton post.


Étant sourd, ça m'a fait plaisir de savoir que VLC integre un soustitrage auto et ton intervention. J'espere que les logiciels libres deviendront petit à petit plus accessible pour nous tous et toutes.

En ce moment ya
#Lokas une app de transcription créée par framasoft et j'aimerais la booster, trouver des fonds car cet outil est génial pour les réunions mais aussi pour nous au quotidien :)

Merci pour le rappel pratique @snoopy et @jor Bon rappel que généraliser est toujours abuser.

Notez la transcription texte automatiques des #podcast de la plate-forme open source #Castopod (@castopod) . Présentée par @projetslibres_podcast ici par exemple https://piaille.fr/@projetslibres_podcast/112517059149636060

cc @emeline

Podcast Projets libres ! (@[email protected])

Revivez la conférence "Créez, diffusez et interagissez. (Re)prenez le contrôle grâce au Podcast libre !" aux #jdll2024 🚀 🎧 👉 https://www.projets-libres.org/conference-creez-diffusez-et-interagissez-reprenez-le-controle-grace-au-podcast-libre/ 🎙 @[email protected] papa de @[email protected] et @[email protected], hôte de @projetslibres_podcast vous partagent leurs expériences, méthodologies et conseils pour la création de votre podcast avec des outils libres. La conférence est aussi disponible en vidéo sur #Peertube et Youtube.

Piaille
@herouelibre @snoopy @jor @castopod @emeline pour des raisons techniques, sur mes épisodes j'ai fait le choix de proposer une transcription sur WordPress et pas directement dans castopod. Avec les outils actuels faire les deux c'est beaucoup trop de travail. Par contre je propose toujours une transcription enrichie (avec des liens externes et parfois des commentaires), même sur les conférences que j'ai donné ou auxquelles j'ai participé dans les salons. C'est du boulot mais ça permet à tout le monde d'avoir accès au contenu ! Par contre j'ai clairement la volonté de mettre emded transcriptions sur castopod à terme
@projetslibres_podcast @herouelibre @jor @castopod
Interessant, merci :)

Et quels logiciels utilise-tu pour la transcription ?

Idéalement faudrait la meme chose que les conf TED.

Après, je sais pas comment marche un logiciel de transcription mais je me dis qu'il ya moyen de créer un maillage de serveur pour mutualiser leur ressource, calcul et avoir un fichier transcrit sur demande (les mettre en queue et valider définitivement, ne pas refaire la transcription)

Puis, ouvrir un mode collaboratif, style wiki, avec des personnes certifiées pour la correction, réécriture avec un truc du style weblate. Google avait supprimé les soustitres collaboratif, surement ça demande pas mal de maintenance et surveillance des modifications.

Je vais loin, déjà si ça transcrit c'est déjà bien


@emeline

@snoopy @jor @emeline @herouelibre @castopod c'est un peu artisanal de mon côté :
1. une fois l'audio terminé, je le passe soit dans whisper soit une une plate-forme propriétaire
2. je récupère la transcription en texte
3. je l'importe dans wordpress
4. je refais la mise en forme et j'ajoute les liens externes

une piste pour faire mieux :
- sortir la transcription au format srt
- l'importer dans aegisub pour faire une première correction (noms, fautes, etc)
- ça me sort une première transcription que je peux mettre dans castopod
- j'importe cette transcription dans wordpress pour finir le boulot

l'inconvénient c'est que ça demande plus de boulot!