Numéro 12 - focus 🔎

Jordi Brahamcha-Marin :

Utiliser ChatGPT pour une édition numérique de la Bibliographie de la France
https://doi.org/10.4000/15icl

Dans le cadre du programme ANR e-BdF, qui vise notamment à produire une édition numérique partielle des sections littéraires de la Bibliographie de la France, j’ai utilisé ChatGPT pour traiter les notices bibliographiques tirées de cette source imprimée, c’est-à-dire les analyser et les transformer en un jeu de données structuré. Il s’est avéré possible, en effet, de déléguer partiellement à ChatGPT un travail qui est fastidieux s’il est fait à la main et qui ne peut pas être efficacement réalisé au moyen d’expressions régulières. Le présent article décrit précisément le protocole mis en œuvre, en particulier la manière dont l’usage de ChatGPT a été combiné avec l’usage de scripts Python simples ainsi qu’avec des interventions humaines (travail d’élaboration, de régie, de relecture). Cette méthode, relativement simple à adopter, y compris pour un non-expert, se révèle très efficace.

#HumanitésNumériques #bibliographie #LLM

Utiliser ChatGPT pour une édition numérique de la Bibliographie de ...

Le 30 novembre 2022, le lancement du chatbot ChatGPT, basé à l’époque exclusivement sur le modèle GPT 3.5 d’OpenAI, a eu un retentissement mondial. Une large part du grand public a soudainement pri...

Vous étudiez le système de la communication savante, la diffusion de la #recherche ou vous avez un projet de recherche qui applique des méthodes des #HumanitésNumériques ?

Appliquez aux bourses #CoalitionPublica avant le 19 avril 2026 23h59 HP !

Pour en savoir plus et postuler : https://www.coalition-publi.ca/fr/appel-bourses-recherche-2026/

Appel à candidatures : Bourses de recherche Coalition Publica 2026

Coalition Publica se réjouit d'offrir des bourses de recherche aux étudiant·e·s à la maîtrise et au doctorat qui s'intéressent aux méthodes des humanités numériques ou l'étude de l'écosystème de la publication savante.

Coalition publica

Numéro 12 - focus 🔎

Simon Gabay, Ariane Pinche, Peter Nahon, Alix Chagué, Pauline Jacsont, Élodie Paupe, Jean-Claude Rebetez, Maxime Humeau, Christine Payot, Thibault Maillard, Yvan Jauregui, Elina Leblanc et Loraine Chappuis :

Lire avant de faire lire. Réflexions philologiques sur la reconnaissance automatique de texte pour les manuscrits modernes français
https://doi.org/10.4000/15ick

Dans le domaine francophone, le manuscrit écrit après le Moyen Âge reste le dernier type de document qui n’est pas correctement traité par les outils de reconnaissance automatique de texte. Si des modèles ont déjà été publiés, leur efficacité et leur documentation restent insatisfaisantes, en grande partie à cause des difficultés que suscite l’importante évolution des documents eux-mêmes au cours des siècles, et donc la diversité des formes à traiter. Après avoir décrit le problème d’un point de vue philologique, nous proposons ici quelques réflexions préliminaires sur la transcription des documents modernes, ainsi qu’un nouveau modèle visant à améliorer les conditions de travail des chercheurs et chercheuses, en attendant de concevoir une solution pleinement satisfaisante.

#HumanitésNumériques #transcription #OCR #HTR

Lire avant de faire lire. Réflexions philologiques sur la reconnais...

Introduction Une part non négligeable de la littérature et des documents d’archives rédigés après le Moyen Âge est encore conservée sous forme manuscrite. Or, contrairement à ceux de l’époque médié...

Nouvelle publication #HumanitésNumériques

R. El-Idrissi, J. Simon-Reig, L. Romero, J. Agoun, J.P. Girard, G. de-Prado, J. Darmont, S. Loudcher, "Structuration, exploration et valorisation d'archives archéologiques par l’intelligence artificielle au sein d’un lac de données", 7e Colloque de l’association francophone des Humanités numériques (Humanistica), Paris, Mai 2026.

https://eric.univ-lyon2.fr/jdarmont/?p=9110

Nouvelle publication #HumanitésNumériques – Jérôme Darmont

RE: https://mastodon.acm.org/@mxp/116022427362651937

Petit rappel: nous avons actuellement poste d'assistant·e diplômé·e (= doctorant·e) en humanités computationnelles à repourvoir dans notre section.

Délai de candidature: 20 avril 2026.

#HumanitésNumériques #DigitalHumanities #ComputationalHumanities #AcademicJob

Envie de partager vos méthodes de recherche en #HumanitésNumériques ?

💎 Tout ce que nous publions est en #AccesOuvertDiamant.

Notre édition francophone recherche des propositions de nouvelles leçons originales ou de traductions.

🔗 https://tinyurl.com/aac-2026-info

🗓️ 20 avril 2026

#AppelAContributions

RE: https://social.numerique.gouv.fr/@hal_fr/116137033802662929

Un article intéressant. Quand vous devez gérer des serveurs il faut savoir et comprendre qui demande accès à vos données. On peut pas tout savoir mais le comportement du bot est sous surveillance et des stratégies sont mises en places.
#hal #ccsd #humanitesNumeriques #bot #filtrage #acces #strategie #data #datascience

Journées portes ouvertes de l’Institut de la communication (ICOM) – Jérôme Darmont

Journée Portes Ouvertes de l'ICOM 2026 - Institut de la communication

Institut de la communication

Numéro 12 - focus 🔎

Julien d’Huy :
Quand l’arbre ne tient plus qu’à ses branches : trois essais récents pour reconstruire un arbre mondial des langues
https://doi.org/10.4000/15ici

https://journals.openedition.org/revuehn/5287

La phylogénie des langues connaît aujourd’hui un essor sans précédent grâce aux outils computationnels empruntés aux sciences de la biologie. Cet article examine trois tentatives récentes de reconstruire un arbre mondial des langues, fondées sur des données et des méthodes très différentes : typologie structurale, lexique phonétisé, modèles mixtes bayésiens. Il interroge la validité du modèle arborescent à l’échelle globale, la fiabilité des algorithmes utilisés, la qualité et la compatibilité des données, ainsi que les biais implicites dans les choix méthodologiques. Malgré leurs divergences, ces approches laissent voir certains regroupements profonds, suggérant l’existence de structures historiques robustes au sein du bruit des contacts et des convergences. À travers une synthèse comparative, l’article plaide pour une modélisation critique et synthétique de l’évolution linguistique mondiale, articulant héritage vertical et dynamiques horizontales, dans une perspective réflexive, interdisciplinaire et épistémologique.

#humanitésNumériques #digitalHumanities #linguistique #préhistoire

Quand l’arbre ne tient plus qu’à ses branches : trois essais récent...

Introduction La quête d’une arborescence ultime des langues s’inscrit dans une longue tradition intellectuelle visant à retrouver une langue originelle. Umberto Eco, dans La Recherche de la langue ...