I archived the Lawfare Media January 6 Archive with browsertrix-crawler, and tried my first #sciop upload for the WACZ:

https://sciop.net/datasets/lawfare-jan-6

I wonder if it's visible outside of my local network?

Lawfare Media's Archive of Deleted Jan 6 Content - Dataset - SciOp

Preserving Public Information

🎉 #DIDit again. Heute hat das "Kolloquium Wissensinfrastruktur" der UniversitĂ€tsbibliothek Bielefeld, eines der altehrwĂŒrdigsten Formate fĂŒr den Austausch ĂŒber aktuelle Bibliotheksthemen, erstmals im virtuellen Format auf #BigBlueButton stattgefunden, weil ich es erbeten habe. Ich hatte zu den Entwicklungen um die politischen DatensĂ€uberungen durch die Trump-Regierung in den USA und das Datenrettungskollektiv #SafeguardingResearch #SciOp referiert.

Will nur festhalten: Wer referiert, kann auch sein Mitspracherecht wahrnehmen, auf welcher Plattform der eigene Auftritt stattfinden soll. Ich möchte nicht auf #Zoom stattfinden, immer noch nicht, und in Zeiten wie diesen erst recht nicht. Dasselbe gilt fĂŒr Webex, Teams und was es sonst noch fĂŒr KI-fizierte proprietĂ€re Plattformen von Big Tech gibt, denen ich und meine digitale Selbstbestimmung egal bin.
Ihr könnt das auch ✊

Fun Fact: Nur @chpietsch und ich selbst hatten mit einem Privacy hardened Browser Probleme bei der Mikrofonverbindung. Das nÀchste Mal nutze ich wieder die BBB-Instanz von Senfcall, die haben scheinbar eine freundlichere Konfiguration als meine Hochschule, dort funktioniert es jedenfalls alles auf Anhieb (gerade eben noch mal getestet).

#DUTgemacht #DID #DUT #DUTgemacht #Videokonferenz #UnplugBigTech #UnplugTrump #Bibliotheken
@mickylindlar
Komme gerade erst dazu, meine Notizen auszuformulieren, weil ich saß auch in der Session und habe am letzten Tag der #BiblioCon26 selbst noch was zu #SciOp gemacht. Vorausgeschickt: Ich beschĂ€ftige mich primĂ€r mit dem Datenhaltungsaspekt von dezentralen Technologien und nicht LZA. Also hier mal ein Feedback von mir aus der zweiten Reihe:
Trotz vieler Beteuerungen fĂŒrchte ich, dass durch die beiden ersten BeitrĂ€ge bei vielen der Eindruck eines Gegensatzes zwischen #BitTorrent und #IPFS entstanden ist. @Lambo hat ja bewusst drauf verzichtet, BitTorrent zu erklĂ€ren. Im zweiten Beitrag wurde auch die Funktionsweise von IPFS nicht erklĂ€rt. Und das ist eben schwierig, wenn zwei Technologien in den Raum gestellt werden, die das selbe Problem lösen sollen und sich dann aufeinander beziehen. So zumindest aus meiner Sicht einer IT-Person, die das dann an der eigenen Institution implementieren wollen wĂŒrde. Ich hoffe mal, die beiden Technologien sind soweit bereits in der LZA Community bekannt, dass das Publikum auch folgen konnte. Bei SciOp ist das Einbinden von CIDs ja bereits möglich, habe ich z. B. bei meinem Upload demonstriert, weil ich betreibe selbst einen IPFS-Knoten: https://sciop.net/datasets/safeguarding-research-and-culture-sciop-article-2026-german-preprint
Wenn IPFS sich manuell per Metadaten bei einer SciOp-Instanz einbinden lĂ€sst, wĂ€re es genauso möglich, dass in eine IPFS-Extension auszuweiten, bei der das alles automatisiert mit IPFS gesynct wird. Dann hĂ€ngen noch die Institutionen ihre Preservation Systeme dran und wir haben auf SciOp das beste aus drei Welten. Die Klarheit ĂŒber diese jetzt bereits bestehende Möglichkeit hat mir irgendwie gefehlt oder sie ist untergegangen.

@RenkeSiems hat die harten berechtigten Fragen zu BitTorrent gestellt, was ich sehr wichtig fand.
Ich habe mich nicht geĂ€ußert, weil ich nicht aufgezeichnet werden will, deswegen noch ein paar Anmerkungen zu beiden BeitrĂ€gen:
1) Über BitTorrent geteilte Daten sind leider durchaus korrumpierbar, zumindest im momentan etablierten Protokoll, das auf SHA1 basiert: https://tixati.com/specs/bittorrent/sha1_problems
Auch deswegen versucht SciOp, BitTorrent v2 zu etablieren, das neuere Kryptoalgos verwendet, aber leider wiederum andere Nachteile hat: https://sciop.net/docs/intro/bittorrent_v2/
2) Dem Problem des Trackings ĂŒber BitTorrent wird heutzutage mittels VPNs oder TOR und Seedboxes begegnet. Das wĂ€re sehr wichtig, das mit einer Guide und Hinweisen bei SciOp hervorzuheben, weil wir davon ausgehen mĂŒssen, dass hier auch gezielt IPs gesammelt werden und Menschen in den USA sind da besonders gefĂ€hrdet.
3) Ein essenzielles Problem von IPFS ergibt sich aus der Praxis, wenn man als Institution selbst einen Knoten betreiben will. (Sidenote: Ich war vor paar Jahren an einer Implementierung von IPFS in DSpace beteiligt, die aber nicht weiterverfolgt wurde.) Wer einen IPFS-Knoten betreibt, der am globalen IPFS-Netzwerk angebunden ist, hostet auch zwangslĂ€ufig Daten von Unbekannten. Dabei kann es sich auch um justiziable Inhalte handeln. Es ist zwar möglich, das nahezu zu minimieren, aber das Problem ist, dass die gĂ€ngigen IPFS-Clients es nicht vorsehen, nur die eigenen Daten zu teilen. Bei uns hatte das letztendlich dazu gefĂŒhrt, eher den Betrieb eines geschlossenen Netzwerks von eigenen IPFS-Knoten in ErwĂ€gung zu ziehen, was ĂŒberhaupt erst Sinn ergeben hĂ€tte, wenn andere Wissenschaftsorganisation mit Knoten dazu gestoßen wĂ€ren, zumindest nach meinem VerstĂ€ndnis von Dezentralisierung.
4) Die Annahme, CIDs wĂ€ren wie Hashes oder "Links, die auf ewig halten" (Zitat Cornelius Ihle), will ich so nicht stehen lassen. Es gibt jetzt schon mehrere Versionen von CIDs. Und selbst ich habe Probleme, ohne meinen Knoten "alte CIDs" zu reproduzieren, weil ich dann irgendwelche custom libraries der IPFS devs rauskramen muss. Sobald kubo (die etablierte IPFS-Knoten Software) bestimmte CID-Versionen nicht mehr unterstĂŒtzt, sind diese auch nicht mehr resolvable, also abrufbar. FĂŒr wirklich langfristig reproduzierbar halte ich nur die statischen Hashes der etablierten Kryptoalgos (CRC, MD5, SHA, BLAKE ff.), weil diese libraries breit bis in die Betriebssystemebene eingebettet sind - aber die sind eben nicht resolvable. Es gibt zwar noch per DNS anbindbare Varianten von Decentralized Identifiers (DIDs), die Hashes resolvable machen können, aber das wĂ€re dann noch mal eine andere Diskussion.

#SafeguardingResearch #DataRescue #Langzeitarchivierung #LZA #DigiPres #DigitalPreservation #FDM #FAIRdata #PIDs #OpenAccess #OpenScience #DigitaleSouverÀnitÀt #UnplugBigTech #UnplugTrump #GLAM #Bibliotheken #DigitalHumanities #AcademicChatter
Safeguarding Research & Culture und SciOp: Datenrettung in Zeiten digitaler BĂŒcherverbrennungen (Preprint) - Dataset - SciOp

Preserving Public Information

Heute am letzten Tag der #BiblioCon26 wird noch mal ein Licht im Dunkeln entzĂŒndet. Um 11:30 im Freiraum geht es um "Datenrettung in Zeiten digitaler BĂŒcherverbrennungen". Ich werde einen Einblick geben in die Freiwilligeninitiative @SafeguardingResearch und deren Open-Source-Plattform #SciOp.

@Lambo hatte bereits am Mittwoch eine zusammen mit Teilen des SciOp-Teams ausgearbeitete PrĂ€sentation auf die BiblioCon gebracht, dabei insbesondere die VorzĂŒge von BitTorrent fĂŒr unsere Repositorien in #Bibliotheken hervorgehoben, um Daten dezentral verteilt, zensurresistent und manipulationssicher vorhalten zu können. Das TIB OSL hat gerade mit dem Projekt SHIELD begonnen, den Aufbau einer eigenen SciOp-Instanz vorzubereiten.

Ich werde heute die Entstehung der Initiative Safeguarding Research & Culture nachzeichnen, die SciOp hervorgebracht hat, und das im Kontext der durch die Trump-Regierung orchestrierten Angriffe auf GLAM, marginalisierte Gruppen und die Scientific Community im Jahr 2025. In der restlichen Zeit schauen wir uns mal zusammen an, wie das Datenretten ĂŒber BitTorrent und die SciOp-Plattform in der Praxis funktioniert.

Kommt doch gern rum 😃

#SafeguardingResearch #DataRescue #FDM #FAIRdata #OpenScience #Wissenschaft #Forschung #OpenAccess #GLAM #Bibliotheken #DigitalHumanities #AcademicChatter #DigitaleSouverÀnitÀt #UnplugBigTech #UnplugTrump #Informationswissenschaft #Bibliothekswissenschaft
For my English-speaking friends:
The preprint of my article here covers the founding history and backgrounds of the #DataRescue collective @SafeguardingResearch and its #OpenSource platform #SciOp + includes an IT librarians take on this project: https://doi.org/10.5281/zenodo.19218030

This is #Fediverse history not to be forgotten, that's why it is also uploaded to SciOp itself, so feel free to seed: https://sciop.net/datasets/safeguarding-research-and-culture-sciop-article-2026-german-preprint
Thanks to @jonny for helping me out on this one :))

This paper is submitted to be published with the special issue "Out of Order: Queer, Critical and Inclusive Perspectives on Order and Disruption" of the German library journal "Bibliothek Forschung und Praxis" later this year. CfP by @fuzzyleapfrog et al. is still open until mid June if you want to contribute as well: https://doi.org/10.1515/bfp-2025-0060

If any German-speaking person has the time to translate my article, go for it, it's under CC-BY-SA-NC.

Happy #WorldBackupDay everyone :)

#SafeguardingResearch #DEI #ResearchData #FAIRdata #RDM #ResearchDataManagement #DigiPres #DigitalPreservation #OpenScience #Science #OpenAccess #GLAM #Libraries #DigitalHumanities #CulturalHeritage #AcademicChatter #Research #UnplugBigTech #UnplugTrump #LIS #InformationScience #LibraryScience
Safeguarding Research & Culture und SciOp: Datenrettung in Zeiten digitaler BĂŒcherverbrennungen

Anfang 2025 sah sich die Scientific Community in den USA einer bisher in diesem Umfang nie dagewesenen politisch motivierten DatensĂ€uberung durch die dort neu gewĂ€hlte Regierung ausgesetzt. In einem Teil des alternativen sozialen Netzwerks Fediverse organisierte sich zu dieser Zeit eine Gruppe engagierter Freiwilliger, um letztendlich ein Guerillakollektiv zur Datenrettung zu bilden, das heute unter den Namen Safeguarding Research & Culture (SRC) bekannt ist. Aus dem SRC-Kollektiv heraus entstand wenig spĂ€ter auch die Open-Source-Software und Plattform SciOp. Diese ermöglicht mittels einer Integration von Datenkatalog und BitTorrent-Tracker eine dezentral verteilte und koordinierte Datenhaltung, an der jede Person mit der Bereitstellung von eigenem Speicherplatz und Bandbreite teilnehmen kann, um eine bessere VerfĂŒgbarkeit und zensurresistente Bereitstellung der geretteten Daten zu gewĂ€hrleisten. Dieser Beitrag zeichnet die Entstehungsgeschichte des Projekts nach und stellt dessen Besonderheiten im Vergleich zu konventionellen AnsĂ€tzen und Softwarelösungen im Bibliotheksbereich heraus. Es kann aufgezeigt werden, dass im begrenzten Umfang bekannte bibliothekarische Praktiken adaptiert wurden. Im Gegensatz zu traditionellen Bibliotheken bestehen jedoch neben dem besonderen technologischen Fundament des Projekts auch deutliche Unterschiede hinsichtlich dem Sammelschwerpunkt, der Organisationspraxis und den Partizipationsmöglichkeiten.

Zenodo
Vor einem Jahr hat das #Fediverse Geschichte gemacht: Hier grĂŒndete sich die Datenrettungsinitiative @SafeguardingResearch (SRC) und #SciOp als in den USA die wieder an die Macht gekommene Trump-Regierung systematisch Websites von Wissenschaftseinrichtungen und #Forschungsdaten verschwinden ließ, die nicht ihrem politischen Weltbild entsprachen.

Ich habe nun die Entstehungsgeschichte des SRC-Kollektivs in einem Artikel nachgezeichnet und deren #OpenSource-Software und Plattform SciOp aus (IT-)bibliothekarischer Perspektive analysiert. Das Paper ist bereits jetzt frei und offen als Preprint abrufbar: https://doi.org/10.5281/zenodo.19218030
Weil dieses Zeitdokument nicht verloren gehen soll, ist es auch ĂŒber SciOp selbst geteilt. Werft gerne euren Torrent-Client an und unterstĂŒtzt beim Seeden: https://sciop.net/datasets/safeguarding-research-and-culture-sciop-article-2026-german-preprint

Der Artikel soll dann spĂ€ter im Themenheft "Out of Order: Queere, kritische und inklusive Perspektiven auf Ordnung und Abweichung" der Bibliothekszeitschrift "Bibliothek Forschung und Praxis" erscheinen. Der Call von @fuzzyleapfrog et al. ist ĂŒbrigens noch bis Mitte Juni offen, wer auch etwas beitragen möchte: https://doi.org/10.1515/bfp-2025-0060

Wenn sich jemand berufen fĂŒhlt, meinen Text auf Englisch zu ĂŒbersetzen, wĂŒrde ich mich auch sehr freuen, er steht auch unter CC-BY-SA-NC.

Schönen #WorldBackupDay euch allen :)

#SafeguardingResearch #DataRescue #FDM #FAIRdata #OpenScience #Wissenschaft #Forschung #OpenAccess #GLAM #Bibliotheken #DigitalHumanities #AcademicChatter #DigitaleSouverÀnitÀt #UnplugBigTech #UnplugTrump #Informationswissenschaft #Bibliothekswissenschaft
Safeguarding Research & Culture und SciOp: Datenrettung in Zeiten digitaler BĂŒcherverbrennungen

Anfang 2025 sah sich die Scientific Community in den USA einer bisher in diesem Umfang nie dagewesenen politisch motivierten DatensĂ€uberung durch die dort neu gewĂ€hlte Regierung ausgesetzt. In einem Teil des alternativen sozialen Netzwerks Fediverse organisierte sich zu dieser Zeit eine Gruppe engagierter Freiwilliger, um letztendlich ein Guerillakollektiv zur Datenrettung zu bilden, das heute unter den Namen Safeguarding Research & Culture (SRC) bekannt ist. Aus dem SRC-Kollektiv heraus entstand wenig spĂ€ter auch die Open-Source-Software und Plattform SciOp. Diese ermöglicht mittels einer Integration von Datenkatalog und BitTorrent-Tracker eine dezentral verteilte und koordinierte Datenhaltung, an der jede Person mit der Bereitstellung von eigenem Speicherplatz und Bandbreite teilnehmen kann, um eine bessere VerfĂŒgbarkeit und zensurresistente Bereitstellung der geretteten Daten zu gewĂ€hrleisten. Dieser Beitrag zeichnet die Entstehungsgeschichte des Projekts nach und stellt dessen Besonderheiten im Vergleich zu konventionellen AnsĂ€tzen und Softwarelösungen im Bibliotheksbereich heraus. Es kann aufgezeigt werden, dass im begrenzten Umfang bekannte bibliothekarische Praktiken adaptiert wurden. Im Gegensatz zu traditionellen Bibliotheken bestehen jedoch neben dem besonderen technologischen Fundament des Projekts auch deutliche Unterschiede hinsichtlich dem Sammelschwerpunkt, der Organisationspraxis und den Partizipationsmöglichkeiten.

Zenodo

http://librarypunk.gay/e/160-sciopnet-feat-jonny-and-jez-part-1/

>And this is exactly why Linux distributions have been distributing ISOs using torrents for years. Aside from the sort of piracy thing, that's the other thing that BitTorrent gets used a lot for, and it means that the small organizations throwing up their own Linux distro can distribute it without it completely crashing their tiny servers.

You're not wrong :P Pic related. It annoys me that #tails @tails recently moved away from having torrents as a form of downloading.

>Yeah, it makes me, think about, and something I've thought about before but haven't really explored is you know how when you go on Archive.org and there's a file, and one of your options is just to download a torrent. Why don't we do that for institutional repositories and data repositories?

That's one of my favourite parts of the Internet Archive :D

>Because those are starting to get big. I mean, I know one of the reasons is because, like, we use proprietary software for our institutional repository and Clarabate and Elsevier don't want to support that.

Elsevier, the bane of my academic existence.

-----

Also, vis-a-vis webseeds... what's stopping a Tor onion service from being the HTTP(S) endpoint? Those are pretty damn hard to bring down (from a legal standpoint). I'd assume the main limitation is that BitTorrent clients don't speak "onion service," but that's a fixable problem. Hell, what's stopping the trackers themselves from being onion services?

#BitTorrent #SciOp #Tor #OnionService

RE: https://neuromatch.social/@jonny/116218229348059739

impossible to quote myself because i am always speaking in like a 10-layer run-on, but, still thinking about private/public social systems that support resilient digital social systems, around 33:45....

instead of it being one #sciop and that's a unitary thing, we want to do the same thing here where we have a number of these different trackers that can be online and talk to each other and share metadata back and forth ...

the more important role of a tracker is a site of social coordination, a site of giving organization and structure to a bundle of torrents. in particular giving a focus - in the same way that what cd focused labor towards archiving music, having sciop focusing labor as a place to put the public information torrents is the main thing that it actually does. So building those kind of social systems into the tracker, and the next steps are making those social systems extend across multiple trackers ...

A lot of the peer to peer space, especially post crypto boom can lean very libertarian in terms of its design and its goals. That its goal is to make the one big public archive of everything, and that doesn't exactly fit in this context and it's just a very particular arrangement of power. ... If you build your system around assuming that everything should be public and should always be immediately available, then you don't have the means of making these kinds of gray-area private negotiations and discussions that might need to happen for data that's a little more sensitive.

So we need a federation and sharing model that can scale from private, literally peer-to-peer as in "i want to know exactly who is involved in this swarm of peers" up to the global public index. So that's the next step as far as what we're working on this year.

We were on librarypunk again to talk about #sciop. True to form I talk too much and they had to split it into two parts... Again...

http://librarypunk.gay/e/160-sciopnet-feat-jonny-and-jez-part-1/

We spent a bit too much time talking about bittorrent and not enough time talking about the underlying fascism of it all, but hopefully the goal of a federated tracker for connected communities to self-archive comes thru

160 - SciOp.net feat. Jonny and Jez (part 1) | librarypunk

We’re talking with Jonny and Jez about SciOp, a torrent-focused data preservation project that encourages academics to help with the act of making data available. It’s distributed, it’s robust, and SciOp is working on making it easy to do. [email protected]  Contact Jonny:  Fedi: https://elektrine.com/remote/[email protected] Bsky: https://bsky.app/profile/jo.nny.rip Media mentioned https://sciop.net/ https://forum.safeguar.de/about https://blog.sciop.net/2025-08-29/webseeds  https://punctumbooks.com/titles/warez-the-infrastructure-and-aesthetics-of-piracy/  Safeguarding/sciop: collecting at-risk data in torrent rss feeds - Codeberg.org - https://codeberg.org/safeguarding/sciop- the scraping code, such as it is: https://codeberg.org/Safeguarding/sciop-scraping - sciop the blog, such as it is: https://blog.sciop.net/ https://programminghistorian.org/ https://book.the-turing-way.org/  last episodes on federation: https://www.librarypunk.gay/e/101-mastodon-bluesky-and-bullshit-part-1-feat-jonny-saunders/ https://www.librarypunk.gay/e/102-mastodon-bluesky-and-bullshit-part-2-feat-jonny/  Tools mentioned webrecorder, browser trix https://webrecorder.net/  https://webrecorder.net/browsertrix/ academictorrents - academic data tracker https://academictorrents.com/ aggregor mauve https://agregore.mauve.moe/  DRP - lumos https://www.icpsr.umich.edu/sites/datalumos/home https://en.wikipedia.org/wiki/Distributed_hash_table  https://torrentfreak.com/controversy-as-rookie-admin-aspires-to-bittorrent-domination-080730/  ddos secrets https://ddosecrets.org/  Archive Team Warrior https://tracker.archiveteam.org/  How to contribute to sciop  https://sciop.net/docs/quickstart/  Create account. Create a torrent. [find how to link for how to create a torrent] Upload.  Get permission so they are visible to others.  Seed. Transcripts: https://podscripts.co/podcasts/librarypunk  Join the Discord: https://discord.gg/qWPTurTnkT

#sciop is now DMCA registered agent official thanks to a generous corporate sponsorship by Peertech Global Cyberindustrial Concern, LLC.