@hist_myth Justement, je me méfie des "phrases courtes" de Trump : les digressions incessantes les rendent d'autant plus difficiles à délimiter !
@dam Oui il y a des études qualitatives. Le quantitatif est loin de répondre à toutes les questions !
Florent Moncomble (@f_moncomble@mastodon.online)
Continuant sur ma lancée de « qui a le vocabulaire le plus diversifié », je me suis amusé à vérifier si oui ou non il est vrai que Trump a le lexique le plus pauvre de tous les présidents US.
#linguistique #linguistics @linguistics@a.gup.pe
🧵
MastodonCe sont donc des stats sans valeur — rien de bien surprenant, et ce ne serait pas si sérieux si elles n'avaient pas participé à construire tout un discours qui s'est traduit par la sous-estimation des chances de Trump de remporter l'élection de 2016, et à nouveau celle de 2024…
https://www.nytimes.com/2016/11/13/us/elections/to-our-readers-from-the-publisher-and-executive-editor.html?searchResultPosition=2

To Our Readers, From the Publisher and Executive Editor
After such an erratic and unpredictable election there are inevitable questions.
The New York TimesNon seulement ce calcul automatique se fiche pas mal de savoir si le texte utilise des mots rares ou courants, ou même qui existent, mais il est notoirement casse-tête de segmenter en phrases des prises de parole spontanées, et donc de prétendre compter combien de mots comporte chaque "phrase".
Cette méthode a été maintes fois débunkée sans ménagement, notamment par Mark Liberman sur le Language Log :
https://languagelog.ldc.upenn.edu/nll/?p=15456Language Log » Another dumb Flesch-Kincaid exercise
D'autres « études » se fondent sur un algorithme appelé "Flesch-Kincaid Reading Ease" complètement éclaté au sol. Celui-ci base son calcul du niveau de complexité d'un texte sur la longueur des mots (en nombre de syllabes) et la longueur des phrases (en nombre de mots).
https://www.marieclaire.com.au/news/politics/donald-trump-vocabulary-president-language-analysis/

Study Finds Donald Trump Uses The Vocabulary Of An 8-Year-Old | marie claire
Research has found that Donald Trump uses vocabulary aligned with the complexity of a third grader, but is it an intentional campaign tactic?
marie claireEn effet, plus un corpus est long, plus il a de chances de se répéter, et plus cette proportion s'amenuise (ce que montre le fait que les courbes ci-dessus s'aplatissent à mesure que le nombre de tokens augmente).
Ainsi, des statistiques telles que ci-dessous ignorent qu'une simple comparaison entre la proportion de mots différents (types ou lemmes) sur le nombre de mots total (tokens) ne fonctionne qu'avec des corpus de tailles similaires.
https://www.ibtimes.com/trump-ranks-among-politicians-smallest-vocabularies-3753823

Trump Ranks Among Politicians With Smallest Vocabularies
A study assessed the usage of words used by politicians in the United States and the United Kingdom to determine the person who uses fewer words to get their message across.
International Business Times