Hieran habe ich seit langem gearbeitet: Ein Dashboard zu den Verspätungen & Ausfällen bei der #Bahn. Das entsprechende #OpenData veröffentlicht das Unternehmen in Echtzeit. Auf Mastodon gibt es täglich Infos unter @verspaetung – das Dashboard findet sich unter https://verspaetung.net
Hier schreibe ich zu meinem Arbeitsprozess; verleihe meiner Verwunderung Ausdruck, warum journalistische Medien diesen beeindruckenden Datenschatz nicht nutzen. Und lasse mich zur Zukunft der Softwareentwicklung per #LLM („Künstliche Intelligenz" #KI) aus. https://lorenzmatzat.substack.com/p/verspaetung-punkt-net
verspaetung punkt net

Von Open Data der DB Bahn und der Transformation der Softwareentwicklung

Lorenz' Newsletter
@lorz Sehr tolles Projekt. 🤩 Wäre denkbar, noch Saarbrücken als Nr. 19 hinzuzunehmen? Dann gäbe es fürs Saarland und Rheinland-Pfalz zumindest einen Datenpunkt. Und vielleicht noch einen weiteren relevanten Bahnhof, dann wären es zwanzig, weil: schöne runde Zahl. Über Saarbrücken fahren jedenfalls ein Teil der ICE- bzw. TGV-Verbindungen Frankfurt–Paris(Est). Oder eben auch nicht: Bei Verspätungen auf deutscher Seite wird der Halt oft gnadenlos gestrichen.
@katzentratschen mal schauen. ich denke eher darüber nach, etwas anzubieten ,dass sich jede:r so etwas selbst machen kann für welchen Bahnhof auch immer
@lorz Das wäre auch sehr schick. War auch nicht als »Ey, liefer mal!« zu verstehen. Mir fiel bloß die weiße Fläche auf und ich pendele auf besagter Strecke. 😬

@lorz so stark 👍

auch die Überlegungen zu den Kosten- Einsparungen und Verschiebung der Arbeit zu teilfossiler Energie durch #vibecoding

@lorz weil du die rhetorische Frage nach Projekten und Ausfall-Statistiken gestellt hast: Für https://bahnvorhersage.de/ sammle ich diese Daten seit einigen Jahren. Mittlerweile habe ich die Daten Archive mit mehreren Mrd. Datenpunkten auch veröffentlicht. Darin sind auch die Ausfälle enthalten.

Mehr zu dem Datensatz stelle ich im kommenden Open Transport Meetup am 18.2. vor.

Bahn-Vorhersage

Rankingsystem für Zugverbindungen nach ihrer Anschlusssicherheit basierend auf Machine Learning

@mctoel @lorz

Und so bekommen parallele Gleise eine Weiche.

@lorz hmm und jetzt das ganze mit filtermöglichkeit nach Grund z.b. @evawolfangel besser bekannt als #evatraindestroyer 😂
@lorz Echt Bockstark 👍💪
@lorz
Sehr cool, könntest du den Quellcode evt noch auf GitHub oder ähnliches open-source veröffentlichen? Dann muss man bei Anpassungen trotz vibe coding und co nicht allzu viel neu bauen bzw. kann das ganze in jeder Hinsicht nachhaltiger angehen und bspw. Neuerungen zurück speisen.
@rugk Danke. Ja, dsa k ommt. Dauert aber, weil der Code dafür noch aufgeräumt werden muss. Erstmal werden die Daten als OpenData zugänglich gemacht

@lorz @verspaetung coole Sache und tolle Leistung 🙌

Ich find solche Projekte großartig. Jetzt schön Open Source weiterbauen - dann kann sich @db die Entwicklung ihres eigenes Monitorings sparen und das Geld für andere Zwecke einsetzen 👌

From the people for the people und so

Vielleicht springt dabei ja auch Geld für dich / für euch rum

@verspaetung @lorz
Das ist nice.
Freie Modelle wie GPT-OSS lassen sich mittlerweile auch sehr gut lokal für VibeCoding nutzen.
ContextWindow: Gönn Dir. So macht es auch mehr Spaß, man hat die fossilen Kosten im Griff (und kann zur Not die Heizung runter drehen).

@lorz @verspaetung

Wie kommt das Modell nur mit den ganzen Datenmengen klar. Wahnsinn.

@JEV für verspaetung.net werden nur 18 Bahnhöfe alle 15 Minuten abefragt, das geht. Die API der Bahn liefert die Fahrpläne 5500 Bahnhöfe mit Updates alle 30 Sekunden - die alle abzugreifen wäre ne ganz andere Liga
@lorz
Vlt mit ein formulieringsding oder ein Verständnis zu LLMs, aber @JEV für "das Modell" ist die reine Datenmenge herzlich egal. Die werden ja (im Normalfall) nicht (als prompt oder so) in das Model rein gegeben. Man nutzt es nur um den Quellcode zu schreiben, welcher wiederum dann die Datenmengen verarbeitet bzw. verarbeiten können muss.
@lorz @verspaetung auf Mobilgeräten ist Schleswig Holstein leider von Bannern überdeckt.
@lorz @verspaetung aber cooles Projekt. Werde ich nutzen
@farshidhakimy Danke für den Hinweis. Ja, mobil ist noch nicht das gelbe vom Ei.

@lorz @verspaetung Boah super Sache!

(Also, Deine Arbeit. Nicht die Verspätungen) 😆

@lorz @verspaetung Bockstark, Super Arbeit 💪👍

@lorz @verspaetung

Tolle Sache! 👍
Ist bestimmt auch was für den @holger

@lorz Sind da auch die ausgefallenen Züge drin die die Bahn auf die Art aus der Verspätungsstatistik verschwinden lässt?
@Das_blaue_Pony ja. bzw. ich habe ich die Bahnpressestelle gefragt, ob Ausfälle in die "Pünkltichkeitswerte" einfließen und wie. Ich habe aber keine Antwort bekommen. Soweit ich das verstehe, werden Komplettausfälle bzw. Ausfälle von Halten nicht als Verspätung gezählt.
@lorz ja eben drum fallen ja so viele Züge aus. Die DB schönt damit die eh schon katastrophale Statistik. Ich wüsste aber jetzt auch nicht wie man da eine unbegrenzte Verspätung reinrechnen sollte. Solange die DB kein Ausfallsverbot bekommt und jeden Zug egal mit welcher Verspätung durchziehen muss werden wir nie die Wahrheit über das Ausmaß der Verspätungen erfahren.
@Das_blaue_Pony sie könnten wenigstens Transparenz herstellen; die Daten haben sie intern ja alle. In ihren monatlichen Berichten wird über die Ausfälle kein Wort verloren. Das halte ich für unlauter.
https://www.deutschebahn.com/de/konzern/konzernprofil/zahlen_fakten/puenktlichkeitswerte-6878476
Erläuterung Pünktlichkeitswerte für den März 2026

@lorz @verspaetung Mir gefällt das klare Layout. Vielleicht bald auch als Open Source?
@datenschatz Danke. Ja, OpenSource steht auf dem Zettel. Zuerst kommt eine OpenData-API zu den Daten zu Verspätungen und Ausfällen.
@lorz @verspaetung Was ist deine Auffassung, woher kommt der blinde Fleck oben rechts?
@Unknowable In Mecklenburg-Vorpommern gibt es wenig Menschen und damit auch wenig relevante Bahnhöfe für die Gesamtschau. Siehe https://xkcd.com/1138/
@lorz Leuchtet ein. 👍 Danke.
@lorz @verspaetung und die einzige Quelle ist @evawolfangel traindestroyer? SCNR
@lorz 👋 Lorenz, mega coole Sache die du da aufgestellt hast. Ohne 20GB an Daten herunterladen zu müssen, gibt es eine Möglichkeit den Datensatz vorab auf z.B. Verbindungen zwischen bestimmten Bahnhöfen (z.B HH <> HAN, HH <> UEL) zu limitieren?