Daniel Opitz

@daniel@openbiblio.social
64 Followers
308 Following
464 Posts
An der UB Freiburg. Interessen: Metadaten, Discovery-Systeme, Automatisierung.
This is important to remember, especially in hard times

'On November 28th, 2012, Randall Munroe published an xkcd comic that was a calendar in which the size of each date was proportional to how often each date is referenced by its ordinal name (…) "In months other than September, the 11th is mentioned substantially less often than any other date. It's been that way since long before 9/11 and I have no idea why." After digging into the raw data, I believe I have figured out why.'

https://drhagen.com/blog/the-missing-11th-of-the-month/

The Missing 11th of the Month - David R Hagen

Personal website of David R Hagen, scientific software engineer

❤️ ☑️
Our new blog post: Four bibliographic data science challenges and suggestions for solving them. https://translationpatterns.substack.com/p/four-bibliographic-data-science-challenges
Four bibliographic data science challenges and suggestions for solving them

Towards cooperation between researchers and libraries

Patterns of Translation
Da die Bürgermeisterin nun allerdings doch gemerkt hat, dass es nicht so gut ist, in allen Aspekten von einer Firma abhängig zu sein, hat sie Alex den Auftrag gegeben, per #VibeCoding eine Steuerungssoftware für die Serviceroboter zu erstellen. Bisher sind dabei Betriebssysteme rausgekommen für: einen Kaffeevollautomaten, die Ampelsteuerung für eine sechsspurige Kreuzung und eine Legosteinsortiermaschine.

Das freie Web kollabiert gerade.
Die Zahlen, die Cloudflare-Chef Prince vorstellt, sehen düster aus. Bei Google enden inzwischen wohl 90 % aller Suchanfragen ohne Klick. Bei Antrophic kommt auf 60.000 Anfragen ein Klick. 🤯

https://the-decoder.de/cloudflare-boss-matthew-prince-hat-keine-guten-nachrichten-fuer-das-www/

Cloudflare-Boss Matthew Prince hat schlechte Nachrichten für das WWW

Cloudflare-Chef Matthew Prince sieht das Geschäftsmodell des Internets in akuter Gefahr. Traffic und Monetarisierung für Content-Ersteller brechen zusammen. Schuld daran sind Google, KI-Modelle und naive Lizenzdeals.

THE-DECODER.de
Unser Projektkoordinator Michael Czolkoß-Hettwer macht sich in der
@FAZNET zusammen mit Dirk Jörke stark für mehr #DiamondOpenAccess und zeigt die Ungleichheiten im Wissenschaftssystem auf, die durch DEAL, Metriken und die Macht der Großverlage verstärkt werden https://www.faz.net/aktuell/karriere-hochschule/hoersaal/wissenschaftliche-publikationen-der-deal-ist-nicht-die-loesung-110551626.html
Leider mit Bezahlschranke
Wissenschaftliche Publikationen: Der „Deal“ ist nicht die Lösung

Die Wissenschaft muss neue Wege gehen, um sich aus dem erpresserischen Griff der Großverlage zu befreien. Geld allein reicht dafür nicht.

Frankfurter Allgemeine Zeitung

Die Folien von @SemAntiKast zum Vortrag im Rahmen der Session KI+Veränderung heute Vormittag sind bereits online.

Beachtenswerte Infos zu den sozialen und Umweltfolgen der Nutzung von #KI .

https://opus4.kobv.de/opus4-bib-info/frontdoor/deliver/index/docId/19841/file/Folien_fuer_Veroeffentlichung_Kasprzik.pdf

#bid25 #bibliocon25

Bin den Grünen aus Gründen eher...wisst schon.
Aber...WAS IST DAS FÜR EINE GEILE AKTION???
Klug
Klar
In your face, #klöckner
Die Folien zu @nabatz's und meinem vorgestrigen Vortrag "Metadaten.community – Ein Online-Forum für Metadatenpraktiker:innen" bei der #bibliocon25 finden sich übrigens hier: https://pad.lobid.org/p/mc-bibliocon25
BiblioCon25 - Metadaten.community – Ein Online-Forum für Metadatenpraktiker:innen - HedgeDoc

<style type="text/css"> img.resize {max-height: 80vh; } /* Breite der Folien */ .slide

×
Welche Frage(n) wolltet ihr schon immer mal zum Thema Schattenbibliotheken (z.B. Sci-Hub oder LibGen) stellen? Besucht uns am Mittwoch oder Donnerstag zwischen 12:45 und 13:45 am #bibliocon25 Posterstand und fragt! 🤓
Wir (Nina Gerlach, @benkaden , ich und weitere) freuen uns darüber, ein Poster präsentieren zu dürfen, an dem wir seit dem @leibnizopenscience Barcamp #oscibar2024 gearbeitet hatten - eine Open Educational Resource (OER) zum Thema Schattenbibliotheken. https://doi.org/PQHD
@Lambo @benkaden @leibnizopenscience Wie baue ich am Besten eine private Schattenbibliothek auf?

@hipsterl0s sich soweit wie möglich nicht auf Artikel in der Cloud zu verlassen, sondern Artikel (für den Privatgebrauch) herunterladen & mit Metadaten versehen :)

Die dann zu Teilen ist ein größeres (juristisches) Problem...

@Lambo @benkaden @leibnizopenscience

@Lambo @benkaden @leibnizopenscience Wow, das ist so wichtig, dass ihr das macht! Habt ihr da auch eine englischsprachige Version? Ich würde das so gerne in meinen Trainingsmaterialen für BA Studierende, die bei uns Abschlussarbeit schreiben, verlinken.
@mob @benkaden @leibnizopenscience Vielen Dank! Jepp, dass eine englischsprachige Übersetzung gut wäre denken wir auch, und würde wohl zu unseren nächsten Schritten gehören. Da dies kein Drittmittelprojekt o.ä. ist hängt aber alles von freiwilligen Engagement Einzelner ab, ich halte mich daher bewusst zurück mit Zusagen...
@Lambo @mob @benkaden @leibnizopenscience
wie wäre es mit einem Codeberg-repo mit den einzelnen Texten & Leute können selbstständig Übersetzungen als Pull-Requests anbieten?
@lavaeolus @mob @benkaden @leibnizopenscience Wow, tolle Idee... Weiß nicht ob wir das hinbekommen, aber eigentlich wär's das natürlich
@Lambo @lavaeolus @benkaden @leibnizopenscience Ich finde auch KI Übersetzungen, die man dann von Menschen / Freiwilligen korrigieren lässt, gar kein Problem, wenn das transparent ist!

@mob @Lambo
Ich kann in den nächsten Stunden mal etwas aufsetzen :)

@benkaden @leibnizopenscience

oer-schattenbibliotheken

A repository to coordinate the translations of the OER "Schattenbibliotheken": Heller, Lambert, Nina Gerlach, Ben Kaden, Anna Schwerdtel, and Claudia Voigtländer. Schattenbibliotheken. Zenodo, June 4, 2025. https://doi.org/10.5281/zenodo.15595551.

Codeberg.org

@Lambo @benkaden @leibnizopenscience super wichtig für Forschung.

viel zu viele Ressourcen (auch Steuergelder) fließen in die Journale welche selbst nahezu nichts machen bzw. fast die gesamte Arbeit an Unbezahlte weitergeben und wiederum Milliarden an Profite haben.
Das sind die Bremsen die Forschung und die oben genannten freien Blibliotheken lösen diese Bremsen

@Lambo @benkaden @leibnizopenscience Super Übersicht, danke!
(kurzer Hinweis: Punkt 9, zweiter Stichpunkt: „sind“ hat ein n zu viel.)

@Lambo @benkaden @leibnizopenscience

Ich halte Paywalls für problematisch und auch die Schattenbibliotheken finde ich nicht unproblematisch.

Woher weiß ich, dass da nicht Fake Artikel enthalten sind?

Wenn ich kein Abo bei den Orginal Seiten habe, kann ich nicht wissen und nicht prüfen, ob ich dort nicht vielleicht ein Fakeartikel abrufe, der so gar nicht auf der Originalseite veröffentlicht wurde.

Vertrauen ist gut, Kontrolle ...?

@Rene_M_G @benkaden
Danke für den Kommentar! Um's einordnen zu können: Kannst du bitte Beispiele dafür nennen, also Fälle, in denen Fake-Artikel z.B. über Sci-Hub oder LibGen verbreitet wurden? Falls es journalistisch oder wissenschaftlich dokumentiert nichts gibt, gerne auch erstmal anekdotisch, wenn dir das z.B. selbst schon mal passiert ist.
Übrigens kann und soll dich dieses Poster nicht davon abbringen, Schattenbibliotheken problematisch zu finden - wir behaupten nichts gegenteiliges.

@Lambo @benkaden

Damit damit sprichst du direkt den wunden Punkt an.

Ich kann es nicht prüfen ohne Abo. Aufgrund der Medienvielfalt, würde es sicherlich auch ein teures Unterfangen werden. Sich umfassend zu informieren wird immer mehr zu einem Luxus, sowohl finanziell als auch zeitlich.

Wer prüft die Einträge in eine Schattenbibliothek und wie kann Vertrauen hergestellt werden?
Welche "Schattenbibliothek" ist vertrauenswürdig? Wie wird das sichergestellt, in Zeiten eines hybriden Krieges?

@Rene_M_G @Lambo @benkaden Hier könnte man natürlich auch entgegnen, dass man das ohne Schattenbibliotheken genausowenig überprüfen kann. Die Alternativen sind also: sicheres lack of information vs. potenzielle misinformation. Eine naheliegende Lösung: Open Access.

@awinkler @Lambo @benkaden

Ich verstehe worauf dein Argument abzielt und auch das ist eine Möglichkeit der Desinformation.

Eine Schattenbibliothek erweitert jedoch den Möglichkeitsraum, von Desinformation.

Wie du präferiere auch ich Open Access, doch da bleibt das Spannungsfeld der Finanzierung von arbeitsintensiven Inhalten und das scheint mir kein einfach zu lösendes Problem.

@Rene_M_G @awinkler @benkaden Nein, Paywalls wissenschaftlicher Journals dienen nicht wirklich der Finanzierung arbeitsintensiver Inhalte. Wissenschaftliche Inhalte werden in aller Regel von Forschenden erarbeitet - im Rahmen ihrer öffentlich (oder manchmal von gemeinnützigen Stiftungen o.ä.) finanzierten Arbeit.

@Rene_M_G @awinkler @Lambo

Ich halte das Szenario einer Manipulation von Artikeln in Schattenbibliotheken zwar nicht für ausgeschlossen, aber für sehr unwahrscheinlich. Der Aufwand für die Erstellung und Streuung und der potentielle Ertrag, d.h. dass jemand diese Artikel auch wirklich findet und "nachnutzt", dürften in keinem Verhältnis stehen. Sci-Hub hat meines Wissens auch keinen allgemeinen Upload-Button. Dadurch sind die Manipulationsmöglichkeiten ebenfalls begrenzt.

@Rene_M_G @awinkler @Lambo

Zur Qualitätsprüfung: Jeder wissenschaftliche Text sollte ohnehin kritisch und auf Plausibilität hin gelesen und bewertet werden.

Über OpenAlex kann man sich auch Kontextinformationen zu Autor*innen und Zitationen heranholen. Das hilft bei der Einschätzung.

Generell halte ich die Gefahr einer Manipulation wissenschaftlicher Diskurse durch predatory journals oder gefälschte Zeitschriften bzw. "fake paper" übrigens für deutlich höher.

https://www.nature.com/articles/d41586-023-03464-x

How big is science’s fake-paper problem?

An unpublished analysis suggests that there are hundreds of thousands of bogus ‘paper-mill’ articles lurking in the literature.

@benkaden @Rene_M_G @awinkler @Lambo

In wieweit genau diese Paper-mill-paper in den Schattenbibliotheken vertreten sind, hat glaube ich noch keiner untersucht, oder kennt jemand eventuell eine Studie?

@nina @Rene_M_G @awinkler @Lambo

Ich denke, es wird sie geben und zwar vermutlich in einem Verhältnis ähnlich zu ihrem Aufkommen im generellen wissenschaftlichen Publizieren.

Das Problem sehe ich aber bei den Journals, die diese Texte annehmen.

@nina @benkaden @awinkler @Lambo

Bedenkenswerte Nebeneffekte

"The investigation revealed that 84.83% of the retracted articles available on Sci-Hub do not have any indication of their retracted status."
https://pubmed.ncbi.nlm.nih.gov/39743744/

"The persistence of error: a study of retracted articles on the Internet and in personal libraries"
https://pmc.ncbi.nlm.nih.gov/articles/PMC3411255/

https://greenelab.github.io/scihub-manuscript/v/8fcd0cd665f6fb5f39bed7e26b940aa27d4770ba/

Zurückgezogene Studien schlecht identifizierbar
https://irishinneburg.de/zurueckgezogene-studien-schlecht-identifizierbar/

https://blogs.lse.ac.uk/impactofsocialsciences/2023/10/25/sci-hub-presents-a-paradox-for-open-access-publishing/

An analysis of availability and implications of unlabeled retracted articles on Sci-Hub - PubMed

This study underscores the crucial need for stringent implementation of regulatory measures on retraction suggested by the Committee on Publication Ethics (COPE) or newly published National Information Standards Organization (NISO) recommendations.

PubMed

@Rene_M_G @nina @awinkler @Lambo

Das stimmt.

Interessanterweise sind die Schattenbibliotheken somit das einzige halbwegs systematische Archiv für die Volltexte der "retracted articles" und damit eine wichtige Quelle der Wissenschaftsforschung.

@benkaden @nina @awinkler @Lambo

So könnte man es sehen, wenn sie denn identifizierbar wären.

Doch das ist eben nicht der Fall. Wie aus den verlinkten Artikeln sichtbar haben selbst die kostenpflichtigen genau dieses Problem und kommen dem nicht bei.

@Rene_M_G @nina @awinkler @Lambo

Dann ist es aber ja gerade kein spezifischer Einwand gegen Schattenbibliotheken, oder?

Ich denke, dass Schattenbibliotheken auf ihre Art und unvermeidlich auch die ganze Bandbreite der Probleme des generellen wissenschaftlichen Publizierens mit spiegeln. Daraus kann man ihnen jedoch m.E. keinen Vorwurf machen. Ihr Anliegen ist ja einzig, den Aspekt der Zugänglichkeit der Volltexte zu adressieren.

@Rene_M_G @benkaden @nina @awinkler
Das Problem der Nachvollziehbarkeit formaler Retractions (wie @benkaden schon andeutete: bei weitem nicht alles, was "Fake" ist, wird auch zurückgezogen) ist mit System wie CrossRef Crossmark seit Jahren gut gelöst. CrossMark hängt aber in keiner Weise an Paywalls, sondern kann frei via API angezapft werden. Der Retraction-Status ist nämlich relevant in den Augenblick, in den ich etwas referenziere - und nicht irgendwann möglicherweise lange davor.

@Lambo @nina @awinkler

Danke für die Ergänzung.

Das Hauptproblem, das vermutlich auch @Rene_M_G umtreibt, bleibt aus meiner Sicht, inwiefern Nicht-Expert*innen, die Schattenbibliotheken ja auch gern nutzen, diese Effekte (und Lösungen) kennen, verstehen und reflektieren. Also, wenn man so will, die schattenbibliotheksspezifische Informationskompetenz. Was uns ja zurück zum Anliegen des Posters bringt...

@benkaden @nina @awinkler @Rene_M_G
Ja, und die kritischen Fragen hierzu sind auch absolut willkommen! Wir kennen die Diskussion über die Informationskompetenz, die erforderlich ist, um verschiedene Plattformen/Kanäle richtig zu nutzen, u.a. aus der Diskussion hier in Deutschland zu Covid19-Themen 2020ff. in Bezug auf Preprint-Repositorys. Diese bieten einen Mehrwert für die Wissenschaftskommunikation - aber wir sollten wissen, wie sie funktionieren, um sie richtig zu benutzen.
@Lambo @benkaden @leibnizopenscience Gibt es - seit #scihub nicht mehr archiviert neue Zugägnge zu aktuellen Studien?
@Lambo @benkaden @leibnizopenscience Gehe ich richtig in der Annahme, dass eine Mehrheit der Bibliothekar:innen dabei mithelfen, aber vornehm drüber schwiegen?
@Lambo @benkaden @leibnizopenscience das liest sicherlich jemand, d* das lesen soll: danke!!! ihr seid gerade die größte hoffnung, daß sowas wie "fortschritt" oder "menschheit" doch noch was wird und das gegen massive widerstände. not all heroes wear capes!

@Lambo @benkaden @leibnizopenscience

Wie ähnlich oder unterschiedlich sind die (moralischen) Positionen verschiedener Schattenbibliotheken?

Gibt es z.B. welche, die versuchen, nur Literatur bereitzustellen, bei denen Autor*innen und Kleinverlage nicht unter Piraterie leiden?

@JonasJRichter @Lambo @leibnizopenscience

Das ist mir nicht bekannt. Allerdings findet sich in den Schattenbibliotheken, die ich kenne, vor allem wissenschaftliche Literatur (sci-hub) und ein Potpourri an, nun ja, Freizeit-Scans älterer Quellen, wie man sie auch z.B. archive.org findet (LibGen). Aktuelle Literatur kleiner Publikumsverlage ist mir noch nie begegnet. Ebenso wenig das aktuelle Suhrkamp-Taschenbuch-Programm.

@benkaden @Lambo @leibnizopenscience Ich bin neulich mal auf einen (neuen) Fantasy-Roman gestoßen, aber breiter umgeschaut habe ich mich nicht. Aus der Erinnerung heraus habe ich auch mal eine (für mich verblüffend breit aufgestellte) Schattenbibliothek für Rollenspiele gesehen.
@benkaden @Lambo @leibnizopenscience Aber ja, der Normalfall dürfte sein, dass entlegenere Beispiele aus der Belletristik seltener in Schattenbibliothen zu finden sind.
@JonasJRichter @benkaden @leibnizopenscience
Library Genesis ist manchmal erstaunlich umfassend. Hier kann man es (gefahrlos und legal) einmal ausprobieren: https://www.theatlantic.com/technology/archive/2025/03/search-libgen-data-set/682094/
Bei unseren Recherchen zu dem Poster kam uns der Gedanke, dass LibGen längst selbst zu einer Flaschenpost zur Erhaltung verwaister Werke geworden sein könnte - wohl eher unabsichtlich, und ohne dass dies bisher gezielt erforscht worden wäre. (Uns war dazu jedenfalls keine Forschung begegnet.) #OrphanedWorks
Search LibGen, the Pirated-Books Database That Meta Used to Train AI

Millions of books and scientific papers are captured in the collection’s current iteration.

The Atlantic

@Lambo @JonasJRichter @leibnizopenscience

Das stimmt. Für aktuelle Bücher mit Bremen-Bezug muss man allerdings nach wie vor auf die Werbeanzeige klicken...

Für vergriffene und verwaiste Werke ist es auch aus meiner Sicht mitunter tatsächlich eine Option. Aber auch dazu würde ich zunächst erst zu Archive.org bzw. im Zweifel einem Online-Antiquariat gehen. (Oder, natürlich, in eine Bibliothek.)

@benkaden @Lambo @leibnizopenscience Amen zu allen dreien (Archive.org, Online-Antiquariate, Bibliotheken)! 😃