Susanne Luger und Clara Ginther weisen auf der #bibliocon25 auf eine ungünstige Wechselwirkung zwischen #OpenAccess und #KI hin, die auch mir Sorgen bereitet: In #PaperMills werden massenhaft Artikel KI-generiert, die scheinbar wissenschaftlich wirken, denen aber keinerlei wissenschaftliche Arbeit zugrundeliegt. Frei zugängliche, wissenschaftliche Arbeiten und der diesbezügliche Beitrag von Bibliotheken erleichtern unabsichtlich natürlich auch das maschinelle Anlernen solcher KI-Anwendungen. 😳
@bflaemig manchmal hab ich selbst das Gefühl das ich nicht alle Entwicklungen mitbekomme. Das Ausmaß war mir bisher nicht klar. #bibliocon25
@Beautybaerchi Das konkrete Beispiel von #PaperMills oder #ReviewMills hatte ich auch noch nicht auf dem Schirm. Dass wir mit unserer (grossartigen!) Förderung von Open Access aber einen vermutlich nicht ganz unwesentlichen(?) Beitrag an Trainingsdaten für kommerzielle und manchmal auch fragwürdige Sprachmodelle liefern, stellt mir die Nackenhaare nicht zum ersten Mal auf. Das war ja nicht die Idee. 😳
@bflaemig Ich habe dabei einerseits auch Bedenken, andererseits finde ich es besser, wenn LLMs mit wissenschaftlichen Texten und nicht mit Geschwurbel trainiert werden. Als mindestens ebenso großes Problem sehe ich allerdings, dass unsere Repositorien und Publikationsplattformen durch aggressive KI-Bots lahmgelegt werden:
https://coar-repositories.org/news-updates/open-repositories-are-being-profoundly-impacted-by-ai-bots-and-other-crawlers-results-of-a-coar-survey/
Open repositories are being profoundly impacted by AI bots and other crawlers: Report from a COAR Survey

Executive Summary Every day, multiple bots access the repository at all hours 24/7. We estimate performance degradation due to bot activity about once or twice a day, and at least once a week the s…

COAR