Continuant sur ma lancée de « qui a le vocabulaire le plus diversifié », je me suis amusé à vérifier si oui ou non il est vrai que Trump a le lexique le plus pauvre de tous les présidents US.

#linguistique #linguistics @linguistics
🧵

J'ai récupéré les transcriptions de toutes les interviews et conférences de presse des 7 derniers présidents américains (c'est-à-dire depuis Reagan). Pas les discours, qui sont des prises de parole scriptées et, de surcroit, le plus souvent rédigées par des conseillers.
Cependant, je n'ai pas pris la peine (c'est pas un article scientifique, hein) de supprimer les questions des journalistes — qui 1) représentent une faible part du total, et 2) ne sont guère susceptibles de créer des différences significatives entre présidents. Mais bon, du coup c'est pas parfait.
Ça nous fait :
- Reagan : 166 textes
- Bush (père) : 178 textes
- Clinton : 434 textes
- Bush (fils) : 376 textes
- Obama : 383 textes
- Biden : 64 textes
- Trump (1 & 2) : 154 textes
1er constat : en effet, Trump se prend une claque de la part d'Obama, connu pour ses talents d'orateur.
Mais 2e constat : Obama met en fait une claque à tout le monde, et Trump n'est pas dernier de la classe, faisant légèrement mieux que les Bush, mais aussi que Clinton :
Alors, d'où viennent les allégations selon lesquelles Trump parle « comme un enfant de 8 ans » ? En fait, la méthodologie des « études » qui les sous-tendent est le plus souvent défaillante (pour rester poli)…

Ainsi, des statistiques telles que ci-dessous ignorent qu'une simple comparaison entre la proportion de mots différents (types ou lemmes) sur le nombre de mots total (tokens) ne fonctionne qu'avec des corpus de tailles similaires.

https://www.ibtimes.com/trump-ranks-among-politicians-smallest-vocabularies-3753823

Trump Ranks Among Politicians With Smallest Vocabularies

A study assessed the usage of words used by politicians in the United States and the United Kingdom to determine the person who uses fewer words to get their message across.

International Business Times
En effet, plus un corpus est long, plus il a de chances de se répéter, et plus cette proportion s'amenuise (ce que montre le fait que les courbes ci-dessus s'aplatissent à mesure que le nombre de tokens augmente).

D'autres « études » se fondent sur un algorithme appelé "Flesch-Kincaid Reading Ease" complètement éclaté au sol. Celui-ci base son calcul du niveau de complexité d'un texte sur la longueur des mots (en nombre de syllabes) et la longueur des phrases (en nombre de mots).

https://www.marieclaire.com.au/news/politics/donald-trump-vocabulary-president-language-analysis/

Study Finds Donald Trump Uses The Vocabulary Of An 8-Year-Old | marie claire

Research has found that Donald Trump uses vocabulary aligned with the complexity of a third grader, but is it an intentional campaign tactic?

marie claire
Cette méthode a été maintes fois débunkée sans ménagement, notamment par Mark Liberman sur le Language Log : https://languagelog.ldc.upenn.edu/nll/?p=15456
Language Log » Another dumb Flesch-Kincaid exercise

Non seulement ce calcul automatique se fiche pas mal de savoir si le texte utilise des mots rares ou courants, ou même qui existent, mais il est notoirement casse-tête de segmenter en phrases des prises de parole spontanées, et donc de prétendre compter combien de mots comporte chaque "phrase".

Ce sont donc des stats sans valeur — rien de bien surprenant, et ce ne serait pas si sérieux si elles n'avaient pas participé à construire tout un discours qui s'est traduit par la sous-estimation des chances de Trump de remporter l'élection de 2016, et à nouveau celle de 2024…

https://www.nytimes.com/2016/11/13/us/elections/to-our-readers-from-the-publisher-and-executive-editor.html?searchResultPosition=2

To Our Readers, From the Publisher and Executive Editor

After such an erratic and unpredictable election there are inevitable questions.

The New York Times
@f_moncomble il y a des études sur le type de vocabulaire utilisé ? Au-delà de la variété on dirait aussi qu'il choisit ses mots pour parler à une classe de primaire 🙄 (en tt cas en terme de ressenti)
@dam Oui il y a des études qualitatives. Le quantitatif est loin de répondre à toutes les questions !