Vraiment, OpenAlex c'est de la merde au niveau des données !
3 ans que je le constate et que je le dis, mais on découvre de nouveaux problèmes à chaque fois et on doit mettre en place des solutions de contournement, c'est épuisant.
Si je résume :
- les profils auteurs sont pourris, avec des mauvaises affiliations et souvent plusieurs personnes fusionnées en un seul profil / ORCID correspondant à une autre personne
- les catégories de publications sont souvent erronées (alors que tout est bon à la source)
- les domaines disciplinaire sont souvent pas les bons, aucune prise en compte du contexte
- les mots-clés générés sont à côté de la plaque, sans prise en compte du contexte
- le statut open access est souvent erroné
Franchement, c'est pas possible pour un projet open source bibliographique de ne pas maîtriser la base sur la qualité des données. Je suis sûr qu'ils ont utilisé l'IA n'importe comment, sans tests et sans garde-fou, car pour pourrir les données entrantes à ce point-là, faut le faire !
Dire que des classements et des dotations se basent là-dessus (taux d'open access via OpenAlex), c'est totalement irresponsable.
Dans notre outil BiblioRef, on a dû désactiver la récupération des mots-clés provenant d'OpenAlex car ils sont souvent pas du tout pertinents/à côté de la plaque, ne tenant aucunement compte du contexte.
Ça pourrissait trop notre base de données et nos dataviz.
Donc au final on ne garde que les mots-clés de HAL et du SUDOC.
Comment utiliser bibCheck sur sa bibliographie Zotero ?
https://www.istex.fr/comment-utiliser-bibcheck-sur-sa-bibliographie-zotero/
#CatchOfTheDay
#OpenAccess
on #MENAdoc
"A bibliography of Algeria : from the expedition of Charles V. in 1541 to 1887" by Sir R. Lambert Playfair
[London ?, 1888]