Alexander Doria

@Dorialexander
1.3K Followers
512 Following
321 Posts
Digital humanities researcher, Wikipedia admin and open science activist. Not a number but Q27538435 on Wikidata.
Wikidatahttps://www.wikidata.org/wiki/Q27538435
Bloghttps://scoms.hypotheses.org/

Pierre-Carl Langlais custom-trained a version of ChatGPT on English texts from the 17th century and earlier ...

... so that it speaks like a 17th-century learned monk ...

... whose factual knowledge of the world ends in the 17th century

It's called "Monad-GPT"

Here's a sample of the dialogue

Item #1 in my latest "Linkfest" newsletter, here: https://buttondown.email/clivethompson/archive/linkfest-13-17th-century-chatgpt-the-merovingian/

Linkfest #13: 17th-century ChatGPT, the "Merovingian" knot, and CT scans of knockoff Airpods

Welcome to the latest edition of the Linkfest! "The opposite of doomscrolling", as I call it 😅 Thank you for subscribing -- and if you’re enjoying it, spread...

Un petit appel Ă  contribution : je cherche des exercices de comprĂ©hension de textes en français sous licence libre. IdĂ©alement, un test en QCM sur la base de textes de sujets variĂ©s (littĂ©rature, actualitĂ©, Ă©conomie, etc.) un peu sur le modĂšle des exercices d’anglais en terminal, mais en français.

(Et oui c’est pour Ă©valuer des LLMs).

AprÚs l'avoir parcouru au moment de sa publication, je me suis replongé dans ce papier de @Dorialexander sur #ChatGPT (« Comment ça marche »). Et bien c'est vraiment bien amené, trÚs clair et d'une taille idéal. Je le conseille vivement !
https://scoms.hypotheses.org/1059
ChatGPT : comment ça marche ?

Tout-le-monde en parle : chatGPT rĂ©volutionne l’enseignement, la programmation, la propagande, le marketing, la politique
 Et pourtant, qui est chatGPT ? Tout d’abord deux modĂšles diffĂ©rents, souvent confondus. GPT c’est Generative Pre-trained Transformer 3, un modĂšle gĂ©ant de prĂ©diction de texte entraĂźnĂ© par OpenAI sur 500 milliards de mots. GPT-3 est non seulement capable d’écrire 
 Continuer la lecture de ChatGPT : comment ça marche ? →

Sciences communes
Il y a eu quand mĂȘme quelques avancĂ©es positives depuis quelques annĂ©es. La rĂ©forme europĂ©enne du droit d’auteur a reconnu positivement le domaine public et un peu Ă©rodĂ© les protections abusives (ou "copyfraud"). Le domaine public amĂ©ricain est sorti de son gel de 20 ans et Disney semble avoir jetĂ© l’éponge : Mickey Mouse devient un commun l’annĂ©e prochaine et aucune prolongation n’est envisagĂ©e pour le moment.
Les cĂ©lĂ©brations du domaine public sont un peu en demi-teinte cette annĂ©e : plusieurs pays (dont le Canada et la Nouvelle-ZĂ©lande) sont en train de "geler" les entrĂ©es du domaine public pour vingt ans afin de s’aligner sur la durĂ©e de protection de l’Union EuropĂ©enne (de 50 ans Ă  70 ans post mortem). Et pourtant il y a un consensus croissant pour trouver les durĂ©es de protection beaucoup trop longues et nuisibles au partage de la culture https://mastodon.social/@Dorialexander/109613961902744035
À cĂŽtĂ© du domaine public patrimonial il existe un domaine public "vivant" d’Ɠuvres sous licences libres ou non protĂ©gĂ©es. Et celui-ci est bien parti pour s’enrichir de nouvelles crĂ©ations un peu controversĂ©es : les images gĂ©nĂ©rĂ©es automatiquement. Il y a aujourd’hui plein de dĂ©bats sur leur statut (qui est le crĂ©ateur ? que faire des crĂ©ations dĂ©rivĂ©es d’autres Ɠuvres protĂ©gĂ©es ?). Mon impression personnelle est que, dans leur grande majoritĂ© elles ne sont pas protĂ©gĂ©es.
En France c’est trĂšs compliquĂ© d’estimer le moment oĂč un film entre dans le domaine public (il faut au minimum intĂ©grer les droits du rĂ©alisateur, du scĂ©nariste et du compositeur de la bande son). C’est beaucoup plus simple pour la presse : tous les quotidiens de l’annĂ©e 1952 deviennent des communs et seront probablement bientĂŽt numĂ©risĂ©s sur Gallica (dont, pour bien reboucler l’annĂ©e, l’annonce du couronnement d’Elizabeth II)
En revanche les Ɠuvres amĂ©ricaines toujours protĂ©gĂ©es en Europe sont bien concernĂ©es. Et cette annĂ©e il y a une entrĂ©e importante : les premiers films sonores de 1927 (dont « Le Chanteur de Jazz Â»)! En attendant Mickey Mouse l’annĂ©e prochaine et tous les films classiques amĂ©ricains des annĂ©es 1930.
Aux États-Unis on part de la date de publication (95 ans depuis l’attribution d’un « copyright Â»). Ainsi en rĂ©alitĂ© Sherlock Holmes est dans le domaine public français depuis plus de vingt ans (Conan Doyle est anglais et mort en 1930) : l’expiration du copyright sur les derniers textes publiĂ©s aux États-Unis en 1927 n’a aucune importance. Par contre il faut encore patienter pour Winnie l’Ourson : jusqu’en 2027 pour le texte et
 2047 pour les illustrations!
En France et en Europe on part de 70 ans aprĂšs la mort du crĂ©ateur ou de la crĂ©atrice. L’entrĂ©e dans le domaine public permet de redĂ©couvrir l’Ɠuvre de personnes disparues en 1952, y compris des figures un peu oubliĂ©es mĂȘme si toujours influentes. Par exemple le dramaturge hongrois Ferenc Molnar a beaucoup inspirĂ© la comĂ©die musicale amĂ©ricaine (dont « Carousel Â» adaptĂ© de « Liliiom Â»). Pourtant l’essentiel de ses piĂšces sont inĂ©dites en Français.