Bon alors j'en parlais hier et cette vidéo est assez vide de contenu technique.
Alors que c'est un cas d'école de besoin de lecture distante et que ça en #humanités_numériques ON SAIT FAIRE.
Donc c'est quand que les journalistes vont avoir l'idée de venir nous chercher pour faire un peu de topic modelling là dedans ???

https://www.lemonde.fr/comprendre-en-3-minutes/video/2026/02/06/affaire-epstein-comment-les-journalistes-du-monde-traitent-les-millions-de-documents_6665714_6176282.html?utm_source=dlvr.it&utm_medium=mastodon&dmplayersource=share-send

Vidéo. Affaire Epstein : comment les journalistes du « Monde » traitent les millions de documents ?

Vidéo - Le département de la justice des Etats-Unis a publié une immense masse d’archives liées à l’affaire du prédateur sexuel mort en 2019 et qui sont consultables par tout le monde en ligne. Un défi pour nos journalistes d’investigation.

Le Monde.fr
Si une journaliste passe par là il vous faut un data analyst qui sait faire de l'analyse de réseau et du topic modelling. Il y a plein de politistes et d'historiens formés à ça. On peut vous extraire les noms propres et leurs co-occurences si on a le corpus...
Chercheuses en mal de sous Y A UNE ANR À DÉPOSER.
Les deux chercheuses qui bossent sur les cahiers de doléances des gilets jaunes, allez-y !!!!!

@juliegiovacchini ben il suffit de soumettre les fichiers à un LLM avec un gros abo payant pour qu'il fournisse le résumé en comptant comme il faut, pourquoi s'embêter avec des datanaliss' ?

*Détale à fond les ballons*

@jenesuispasgoth mais en plus tu vas rire mais je serais la première à applaudir quelqu'un qui aurait l'idée d'utiliser un LLM avec du RAG là dessus, ça fait partie des cas où c'est vraiment pertinent - même si on pourrait faire autrement. Ce serait mille fois mieux que la pêche qu'il décrivent.
@juliegiovacchini mais pour moi il y avait d'autres systèmes à base de DNN qui permettent d'avoir des résultats potables sans passer par le bazooka que sont les LLM. Après je suis pas expert en TAL. :)
@jenesuispasgoth il y a plein de façons de faire, t'es clairement pas obligé d'utiliser un LLM. Mais dans un tel cas c'est pas déconnant.