Florent Moncomble

@f_moncomble@mastodon.online
715 Followers
108 Following
934 Posts
Maitre de Conférences en linguistique anglaise | Senior Lecturer in English linguistics | Linguiste atterré @tract_linguistes | #Linguistics #Linguistique #Linguistodon #GrammaireAnglaise #Handicap #Autisme
Présence en lignehttps://linktr.ee/f_moncomble
Corpus toolshttps://corpustools.prendrelangue.fr/
📍Arras, France & Cork, Ireland
Quels fantasmes se cachent derrière l'expression "la langue de Molière"? Extraits de l'émission #laderniere sur @laradionova !
cc @tract_linguistes
@hist_myth Justement, je me méfie des "phrases courtes" de Trump : les digressions incessantes les rendent d'autant plus difficiles à délimiter !
@dam Oui il y a des études qualitatives. Le quantitatif est loin de répondre à toutes les questions !
Florent Moncomble (@f_moncomble@mastodon.online)

Continuant sur ma lancée de « qui a le vocabulaire le plus diversifié », je me suis amusé à vérifier si oui ou non il est vrai que Trump a le lexique le plus pauvre de tous les présidents US. #linguistique #linguistics @linguistics@a.gup.pe 🧵

Mastodon

Ce sont donc des stats sans valeur — rien de bien surprenant, et ce ne serait pas si sérieux si elles n'avaient pas participé à construire tout un discours qui s'est traduit par la sous-estimation des chances de Trump de remporter l'élection de 2016, et à nouveau celle de 2024…

https://www.nytimes.com/2016/11/13/us/elections/to-our-readers-from-the-publisher-and-executive-editor.html?searchResultPosition=2

To Our Readers, From the Publisher and Executive Editor

After such an erratic and unpredictable election there are inevitable questions.

The New York Times
Non seulement ce calcul automatique se fiche pas mal de savoir si le texte utilise des mots rares ou courants, ou même qui existent, mais il est notoirement casse-tête de segmenter en phrases des prises de parole spontanées, et donc de prétendre compter combien de mots comporte chaque "phrase".
Cette méthode a été maintes fois débunkée sans ménagement, notamment par Mark Liberman sur le Language Log : https://languagelog.ldc.upenn.edu/nll/?p=15456
Language Log » Another dumb Flesch-Kincaid exercise

D'autres « études » se fondent sur un algorithme appelé "Flesch-Kincaid Reading Ease" complètement éclaté au sol. Celui-ci base son calcul du niveau de complexité d'un texte sur la longueur des mots (en nombre de syllabes) et la longueur des phrases (en nombre de mots).

https://www.marieclaire.com.au/news/politics/donald-trump-vocabulary-president-language-analysis/

Study Finds Donald Trump Uses The Vocabulary Of An 8-Year-Old | marie claire

Research has found that Donald Trump uses vocabulary aligned with the complexity of a third grader, but is it an intentional campaign tactic?

marie claire
En effet, plus un corpus est long, plus il a de chances de se répéter, et plus cette proportion s'amenuise (ce que montre le fait que les courbes ci-dessus s'aplatissent à mesure que le nombre de tokens augmente).

Ainsi, des statistiques telles que ci-dessous ignorent qu'une simple comparaison entre la proportion de mots différents (types ou lemmes) sur le nombre de mots total (tokens) ne fonctionne qu'avec des corpus de tailles similaires.

https://www.ibtimes.com/trump-ranks-among-politicians-smallest-vocabularies-3753823

Trump Ranks Among Politicians With Smallest Vocabularies

A study assessed the usage of words used by politicians in the United States and the United Kingdom to determine the person who uses fewer words to get their message across.

International Business Times