Auf dem traditionellen Chaos Communication Congress, der dieses Jahr zum 36. Mal stattfindet (diesmal in Leipzig), hat David Kriesel interessante Daten über die tatsächliche Pünktlichkeit der Bahn präsentiert. Der Datenexperte hat unfassbar große Datenmengen analysiert. Mit interessanten Ergebnissen: Der Bahnhof in Köln war mit 380.000 Stopps in 2019 der meist frequentierte Bahnhof Deutschlands. Mit einer Pünktlichkeitsrate von mageren 60 Prozent. Bedeutet: 40 Prozent der Züge nach oder von Köln waren im Jahr 2019 unpünktlich. Weit entfernt von den geschönten Werten, die die Bahn gerne veröffentlicht – sie geht ohnehin erst nach sechs Minuten von einer Verspätung aus.
Lob für die Bahn: Transparenz schaffen
Es geht mir hier nicht um Bahn-Bashing. Auch nicht um Zahlenakrobatik: Wer sich schlau machen möchte über die vielen interessanten Ergebnisse, die David Kiesel ermittelt hat, recherchiere im Netz unter #bahnmining – und wird schnell fündig. Mir ist ein anderer Punkt wichtig. Nämlich, wie wichtig und nützlich es sein kann, möglichst viele Daten, die für die Öffentlichkeit interessant sein können, der Öffentlichkeit auch zur Verfügung zu stellen.
Die Bahn hat hier Lob verdient – für ihre Transparenz. Denn Kriesel durfte die Daten aller (!) Züge und Stopps in Deutschland im Jahr 2019 laden und auswerten. Sie wurden ohne Wenn und Aber zur Verfügung gestellt. Und es waren viele Daten: 40 GByte XML-Daten am Tag, 15 Terabyte für das komplette Jahr. Das ist schon organisatorisch eine Herausforderung. Aber wie man sieht: Es geht. Die Ergebnisse, die Kiesel präsentiert, sind nun faktenbasiert. Fakten! Gestützt auf reale Daten.
Filterblasen entstehen, wenn sich alle nur in Emotionen baden
Weg von Gefühlslagen: Mehr Fakten, bitte!
Fakten statt Gefühlslage: “Die Bahn ist immer unpünktlich. Ich weiß es! Ich fahre Bahn!”. Derlei “Argumente” finden wir in den Sozialen Netzwerken zuhauf. Gequirlte Gefühlsgemengelagen, angereichert mit möglichst vielen Adjektiven auf Emotionsbeet und mit Empörung-Häubchen oben drauf. Das ist Alltag in den Sozialen Netzwerken. Fakten stören nur. Doch genau die würden uns weiterbringen. Nur die.
Deswegen ist das #bahnmining-Projekt so eindrucksvoll. Es dient ideal als Blaupause für zukünftige Diskussionen. An die Stelle von Empörung und Mutmaßung treten Sachlichkeit und Fakten. Wunderbar! Die Politik sollte aus diesem Beispiel lernen. Und alle Behörden und Ministerien fit machen. Es wäre wünschenswert, wenn Behörden relevante Daten sammeln und der Öffentlichkeit zur Verfügung stellen. Die Rohdaten, wohlgemerkt! Je mehr, desto besser. Das bringt uns in der Diskussion und am Ende bei den Entscheidungen weiter.
9 Kommentare
Kommentar Funktionen
“Es wäre wünschenswert, wenn Behörden relevante Daten sammeln und der Öffentlichkeit zur Verfügung stellen. Die Rohdaten, wohlgemerkt!”
Ich habe da gerade ein Scheunentor vor dem Kopf [ :( ] .
Be-hör-den?
Helft mir hier bitte mal mit dem Holzhammer auf die Sprünge … !
– Zum Beispiel, dass die Bundesnetzagentur erfasst, sammelt und veröffentlicht, wie viele “Anlieger sich weigern”, sich an der Verlegung der letzten Meile Glasfaserkabel finanziell zu beteiligen und um welche Summen/Kosten es geht (oder “ginge”)?
——–
Vllt zur Erklärung meines Scheunentors:
Ich habe zwischendurch lose den Werdegang des Urteils des Bundesverfassungsgerichts zu den Hartz-IV-Sanktionen mitbekommen.
Das Bundesministerium für Arbeit und Soziales schien mir “eigentlich” alle Rohdaten für einige Fragestellungen in diesem Gerichtsverfahren zu haben. Es hatte sie “nur nie ausgewertet”. Das wäre jedoch seine Pflicht gewesen.
– Dieser Umstand ist jetzt irgendwie in meinem Kopf verhakt und hat sich da quergelegt.
Einfach mal Fakten – herzlichen Dank!!! Ohne die hochgebauschten, emotional aufgeladenen Stimmungsbilder, Wasserstandsmeldungen, ohne Beziehungs- und Grabenkämpfe über das Internet. Einfach nur eine sachliche Meldung, es ist wie ein Silberstreif am Horizont – die sachliche Meldung natürlich, nicht die verspäteten Bahnen ;-)
Im Ruhrgebiet steigen an den Bahnhöfen oft viel zu viele Leute ein und aus, als das die Bahn bei den engen Taktzeiten überhaupt eine Chance auf Pünktlichkeit hätte.
Das Plädoyer kann ich nur unterstützen, offene Daten, Transparenz schafft Vertrauen und eine echte sachliche Grundlage für Diskussionen.
Etwas was nach meinem Eindruck viele Politiker, aber auch Bürger, immer noch nicht verstanden haben
–
By the way: Es gibt ein wirklich sehenswertes Video über Data-Mining der Artikel von Spiegel-Online. Einfach mal per Qwant, Ecosia und co danach suchen.
(Danke für den Hinweis.)
Hab’ ich getan: Suchmaschine angeworfen, Video gefunden und angesehen.
—
Mich hat die Unaufgeregtheit, Schlichtheit der Präsentation einiger Ergebnisse der Auswertung beeindruckt – ebenso wie auf Anhieb mögliche Interpretationsspielräume (wurde in der Fragerunde kurz angesprochen).
—-
Kurz:
“SpiegelMining” kannte ich noch nicht.
Das Video halte ich auch für Ich-hab-nix-zu-verbergen-Laien für empfehlenswert.
Die Fakten sagen aus, was viele schon von der Bahn wissen. Nur leider ändert sich nichts!
Schon als in 1982 mit der Bahn fuhr, kam sie öfter als ein Mal zu spät. Ich kann leider nicht so weit in die Vergangenheit sehen, doch gefühlt hat sich nichts geändert.
Meiner Meinung nach, sollte man sich an den besseren orientieren. Zum Beispiel Schweiz, Frankreich oder Japan. Doch keiner der Vorstände, Mehdorn war sehr schlimm, hat es geschafft, deutlich etwas zu ändern.
Die Bahn, um es mit einer Satire zu benennen, in der 4.0 Zeit noch immer, wie zu Dampflockzeiten.
Ich denke auch es geht besser und es ist geboten die Zuverlässigkeit der Bahn signifikant zu verbessern.
Bevor man aber jetzt wieder schnell die Bahn aus den Gedanken streicht und ins Auto springt, mal ein Blick auf die Staudaten. Laut ADAC Statistik gab es 2018 264000 Staus über eine Länge von 486000 Kilometer. Ein Zuwachs von 6,4% gegenüber 2017.
Doch für diesen Artikel interessant: Die zugrundeliegenden Daten des ADAC sind nicht öffentlich und die Subjektivität des ADAC gefühlt bekannt. Und schon sind hier Tür und Tor für Zweifel geöffnet. Die Bahn macht es da besser.
“Und es waren viele Daten: 40 GByte XML-Daten am Tag, 15 Terabyte für das komplette Jahr. ”
Das waren es eben nicht auf Grund der riesigen Datenmenge. Herr Kriesel hat daher nur die Haltestellen der Fernverbindungen untersucht. Bitte nochmal genau seinem Vortrag zuhören.
Ich hab den Vortrag nur mit “halbem Ohr” gehört.
Kann aber nur beipflichten. Es wird explizit gesagt, dass es mit 15 TB zu viele Daten gewesen wären.
“Fakten stören nur. Doch genau die würden uns weiterbringen. Nur die. ”
Grüße an die ARD Redaktion.
2022 und der Artikel ist noch immer Fehlerhaft (inkl Kiesel statt Kriesel als Namen mehrfach im Text)…..