Schweizerische Bundesbahnen optimieren Zugabläufe SBB – Data Analytics für Verspätungsursachen

Die Schweizerischen Bundesbahnen (SBB) gelten als einer der pünktlichsten Bahnbetreiber in Europa. Das reichte dem Unternehmen jedoch nicht. Eine neue Data-Analytics-Softwarelösung identifiziert und klassifiziert die Gründe von Fahrplanabweichungen nun vollautomatisch, um dann systematische Ursachen konsequent beseitigen zu können.

Anbieter zum Thema

Pünktlichkeit ist eine der wichtigsten Kennzahlen bei der SBB und deren Verbesserung wird mit sehr viel Aufwand und modernsten Tools vorangetrieben. EFA ist eines der zentralen Tools, welches dafür die bestehende Datenbasis durchforstet und mögliche Verspätungsursachen zur Beseitigung aufzeigt.
Pünktlichkeit ist eine der wichtigsten Kennzahlen bei der SBB und deren Verbesserung wird mit sehr viel Aufwand und modernsten Tools vorangetrieben. EFA ist eines der zentralen Tools, welches dafür die bestehende Datenbasis durchforstet und mögliche Verspätungsursachen zur Beseitigung aufzeigt.
(Bild: SBB)

180 Sekunden, ab diesem Schwellwert gilt in der Schweiz ein Zug bereits als verspätet. Trotz des knappen Zeitfensters erreichten 92,6 Prozent der Personenzüge im Jahr 2020 pünktlich ihr Ziel. Mehr als 99 Prozent der Fahrgäste konnten ihre geplanten Anschlusszüge erreichen.

Die SBB könnte also mit ihrem Bahnverkehr zufrieden sein. Zumal sie eines der dichtest befahrenen Bahnnetze der Welt besitzt, gepaart mit einer anspruchsvollen Topologie. Ist sie aber nicht. Deswegen erfassten und bewerteten seit circa 20 Jahren Disponenten jede Verspätung eines Personen- oder Güterzugs in einer Software.

Daniele Guidetti, Product Owner und fachlicher Verantwortlicher bei der SBB
Daniele Guidetti, Product Owner und fachlicher Verantwortlicher bei der SBB
(Bild: SBB)

„Bisher weitgehend manuelle Arbeit“, erklärt Daniele Guidetti, Product Owner und fachlicher Verantwortlicher bei der SBB, obwohl das bisherige Tool „Ereignisse Zugverkehr“ (ErZu) die offiziellen Fahrpläne mit den tatsächlichen Zeiten der Züge verglich und alle Züge mit mehr als drei Minuten Verspätung anzeigte. Aber die Disponenten, deren Kernaufgabe nicht Statistiken pflegen, sondern der zügige Fortlauf des Zugbetriebs insbesondere bei Störungen ist, mussten für jede aufgelistete Verspätung manuell ein Ereignis und eine Ursache für die Verspätung anlegen.

„Das Problem war, dass es kaum möglich war, bei vielen gleichzeitigen Ereignissen mit der Erfassung hinterher zu kommen. Die Qualität der Verspätungsbewertungen war daher insgesamt suboptimal“, sagt Guidetti. „Zudem war die Usability mühsam und das System alt. Dadurch waren die Arbeitsabläufe umständlich und es gab Redundanzen bei der Erfassung.“ Bereits am Altsystem „ErZu“ hing der gesamte Nachbearbeitungs- und Verbesserungsprozess. Es war herauszufinden, was die Verspätung ausgelöst und welche Folgen eine Verspätung hatte. „Schlussendlich ist das Ziel, besser zu werden, indem wir Maßnahmen aus der Gesamtheit an verfügbaren Informationen ableiten, damit die gleichen Verspätungen nicht immer wieder passieren“, erklärt Guidetti.

Im gesamten SBB-Konzern nutzen eine ganze Reihe von Abteilungen die manuell erfassten Daten für verschiedene Zwecke. Dafür werden die Daten über Schnittstellen in weitere Lösungen übertragen, mit denen die SBB unter anderem Kennzahlen für die Qualität des Betriebs berechnen kann. So muss sie dem Bundesamt für Verkehr Pünktlichkeitsauswertungen vorlegen oder der Internationale Eisenbahnverband UIC (Union internationale des chemins de fer) bekommt über eine Standardschnittstelle die Gründe für die Verspätungen gemeldet.

Vollautomatisierte Intelligenz statt manueller Erfassung

Logo von EFA
Logo von EFA
(Bild: SBB)

Die manuelle Erfassung von Verspätungsbegründungen ist bei der SBB nun seit Juni 2021 Geschichte. Mit einem Big Bang schaltete die IT das alte ErZu-System ab. Seitdem läuft die neu entwickelte Software EFA, die „Erfassung Fahrplanabweichung“. Die Innovation: Völlig automatisiert erfasst das System jetzt alle Verspätungen und wertet sie aus. Start für das umfangreiche Projekt war 2016, zu einer Zeit, in der die SBB ihre Digitalisierung massiv vorantrieb.

„Für das Fachkonzept von EFA erfassten wir zunächst, welche Bedürfnisse die Stakeholder im Konzern haben“, sagt Product Owner Guidetti. „Es zeigte sich rasch die enorme Anzahl derjenigen, die in irgendeiner Weise Verspätungsdaten brauchen und verarbeiten.“ Das dementsprechend herausfordernde Fachkonzept ging dann auch der IT-Abteilung zu, die gemeinsam mit der Management- und Technologieberatung Detecon und dem IT-Dienstleister T-Systems die technische Machbarkeit prüfte und danach die Realisierung vollzog.

In EFA werden nun täglich mehrere Terabytes an Daten aus verschiedenen anderen Systemen gesammelt und verarbeitet. EFA untersucht auf Basis von Big Data Analytics die Fahrpläne vollautomatisiert und findet durch die Kombination aller angeschlossenen Datenquellen die Ursachen für Verspätungen heraus. Dafür importiert das Tool täglich alle vorhandenen Fahrpläne des Personen- und Güterverkehrs sowie die Informationen zu den tatsächlichen Fahrzeiten und verarbeitet die Daten im Vier-Stunden-Takt.

Das ebenfalls durch die SBB entwickelte Rail Control System (RCS) erfasst zum Beispiel Informationen im Sekundentakt – von der Planung bis zur Steuerung des Zugverkehrs. Es berechnet unter anderem alle zwei Sekunden Positionen und Verkehr auf dem gesamten Bahnnetz der Schweiz mit einem Prognosehorizont von zwei Stunden. Es erkennt Konflikte frühzeitig und exakt, was die Fahrplanstabilität erhöht und tausende Zuglenkungen optimiert. Aus dem RCS werden dann sämtliche relevanten Daten, die die aktuelle Betriebslage beschreiben, rausgezogen und bei der Ursachenbewertung berücksichtigt.

Hohe Anforderungen an Big-Data-Infrastruktur

Gernot Stocker, Detecon-Berater und externer IT-Leiter des Projekts
Gernot Stocker, Detecon-Berater und externer IT-Leiter des Projekts
(Bild: Detecon)

Damit diese komplexen Analyse- und Verarbeitungsaktivitäten reibungslos und in hoher Qualität ablaufen konnten, bedurfte es einer intelligenten Orchestrierung zugehöriger Big-Data-Technologien. Gernot Stocker, Detecon-Berater und externer IT-Leiter des Projekts, verantwortete sowohl die Analytics-Strategie als auch die technische Umsetzung des Projekts. „Eine große Herausforderung lag zunächst in den äußerst heterogenen Datenformaten, die ganzheitlich betrachtet werden mussten, um schlüssige Aussagen hieraus ziehen zu können“, erklärt Stocker.

„EFA verarbeitet erstens strukturierte Daten aus relationalen Datenbanken, wie etwa sich stetig ändernde Topologiedaten. Hinzu kommen zweitens Fahrplandaten – zugeliefert als Stream-Daten im XML-Format aus dem Echtzeitbetrieb des RCS -, die gesamtheitlich die aktuelle Verkehrslage beschreiben.“ Hierzu erstellte das Team Analyse-Pipelines, die diesen Echtzeitstrom zyklisch entgegennehmen und den Auswertungsprozessen zuführen.

„Eine weitere wichtige Datenquelle ist das Kommunikationstool der Disponenten (ALEA), woraus wir aus deutschen, italienischen und französischen Textmeldungen wichtige Informationen zu Verspätungsursachen extrahieren“, fährt Stocker fort. Mithilfe von Natural Language Processing wurden aus historischen Chatnachrichten initial drei sprachspezifische Schlagwortlisten erzeugt und von Bahn-Spezialisten manuell erweitert. Diese regelmäßig gepflegten Schlagwortlisten kommen nun täglich zum Einsatz, um im kontinuierlichen ALEA-Datenstrom zeitliche und örtliche Zusammenhänge von Verspätungsursachen zu identifizieren. „Nur die kombinierte Beurteilung der unterschiedlichen Datenquellen ergibt ein zutreffendes Gesamtbild.“

Aufbauend auf einer Docker- basierten Cloud-Architektur steuert die Workflow-Engine Azkaban die Ausführung der in Spark/Java realisierten Analyse-Prozesse. Sämtliche relevanten Informationen werden aus unterschiedlichen Datenquellen auf der Cloudera-basierten Hadoop-Plattform konsolidiert und im Anschluss verteilt verarbeitet. Ergebnisse werden an die Umsysteme zur Visualisierung und Weiterverarbeitung zur Verfügung gestellt.
Aufbauend auf einer Docker- basierten Cloud-Architektur steuert die Workflow-Engine Azkaban die Ausführung der in Spark/Java realisierten Analyse-Prozesse. Sämtliche relevanten Informationen werden aus unterschiedlichen Datenquellen auf der Cloudera-basierten Hadoop-Plattform konsolidiert und im Anschluss verteilt verarbeitet. Ergebnisse werden an die Umsysteme zur Visualisierung und Weiterverarbeitung zur Verfügung gestellt.
(Bild: SBB)

Komplexe Anforderungen musste auch die Architektur der Gesamtlösung bedienen: Gestartet wurde das Projekt mit einem klassischen Hadoop-Stack, kombiniert mit Apache Spark, einer Java-basierten Analytics Engine, welche über Docker Container bedient wird. „Um einen industrialisierten Analytics-Ansatz zu realisieren, verließen wir bald das Proof-of-Concept-Stadium in Richtung eines Produktivsystems, das von einem DevOps-Team 24x7 stabil betrieben wird.“, erläutert Gernot Stocker.

Eine Herausforderung lag in der Auswahl und Komposition von geeigneten Einzelkomponenten zu einem Gesamtsystem: Hierzu zählte z. B. die Wahl einer Open Source Workflow Engine, die letztlich auf Apache Azkaban fiel.

Zudem kommen MySQL als relationale Datenbank für die Speicherung von Konfigurationen, OpenShift-Cluster für die automatische Skalierung und Kubernetes Docker-Container für die Kapselung der Verarbeitungsprozesse zum Einsatz.

Hohe Anforderungen liegen neben der Stabilität vor allem im immensen Datenvolumen sowie der zugehörigen Überwachung von Workflows, die im Hintergrund parallele Jobs auf dem Hadoop-Cluster absetzen. Da dieser nicht nur dediziert für das Projekt arbeitet, galt es zudem, diesen nicht zu überlasten und den Regulär-Betrieb nicht zu beeinträchtigen.

Agiles Vorgehen

Möglichst alle bisherigen Schnittstellen weiterhin zu bedienen, war eine weitere Herausforderung: „Die bestehenden Systeme müssen wie vom Altsystem gewohnt mit Daten beliefert werden. Zum Beispiel müssen Verspätungen gemeldet werden, damit wir unseren Grundauftrag für die Erfüllung der Qualitätssicherung gegenüber dem Bund als Eigner der SBB erfüllen können. Auch die UIC fordert die Erfassung von Verspätungen mit deren Ursache und Bereitstellung der entsprechenden Daten an die verschiedenen Transportunternehmen“, betont SBB-Projektleiter Daniele Guidetti. Weiterhin galt es unter anderem aussagekräftige Daten an die Reporting-Systeme, die für Statistik, Analyse und Optimierungsansätze verwendet werden, über möglichst nutzerfreundliche User Interfaces zu liefern.

„Die agile Vorgehensweise gemeinsam mit dem Business war einer der Erfolgsfaktoren für die Umsetzung des Projekts“, resümiert Gernot Stocker. „Wir starteten schnell mit einer lauffähigen Version, die wir dann kontinuierlich im DevOps-Team weiterentwickelt haben. Mit Transparenz über die Ergebnisqualität der neuen Technologien konnten wir Vorbehalte gegenüber EFA schnell ausräumen und Vertrauen im Management gewinnen.“ Mittlerweile wurde das Projekt EFA im Rahmen der regulären Produktpflege und -weiterentwicklung in die skalierte SAFe (Scaled Agile Framework)-Organisation der SBB überführt.

Lösung macht Verspätungsursachen transparent

Von der nun automatisierten Erfassung der Fahrplanabweichungen sind die Disponenten in den Betriebszentralen begeistert. Wurden aufgrund der hohen Belastung früher manche Verspätungen stillschweigend ignoriert oder im falschen Ereignis verbucht, steht ihnen heute durch den Wegfall der manuellen Erfassung mehr Zeit für ihre eigentlichen Dispositions-Aufgaben zur Verfügung.

Singuläre Initialursachen von Verspätungen, wie sie in diesem Bild von EFA in rot identifiziert werden, können weit reichende Auswirkungen auf nachfolgende Züge haben. Auch ursprünglich geringe Verspätungen können zu großen Verspätungen im Gesamtnetz führen.
Singuläre Initialursachen von Verspätungen, wie sie in diesem Bild von EFA in rot identifiziert werden, können weit reichende Auswirkungen auf nachfolgende Züge haben. Auch ursprünglich geringe Verspätungen können zu großen Verspätungen im Gesamtnetz führen.
(Bild: SBB)

Zudem macht EFA jetzt Verspätungsursachen transparent, an die früher niemand gedacht hat. Beispiel Regenwetter. Fährt eine S-Bahn zur Rushhour im Regen, machen an jeder Haltestelle Fahrgäste vor dem Einstieg zunächst ihre Schirme zu. Damit überschreitet der Zug an jeder Haltestelle seine eingeplante Haltefrist. Am Schluss kommt der Zug mit zehn Minuten Verspätung an der Endhaltestelle an. „Dieser Zusammenhang wurde früher nicht detektiert. Mit EFA können wir solche schleichenden Verspätungen nun gut erkennen und als solche ausweisen. Wir konnten jetzt feststellen, dass rund ein Drittel aller Verspätungen auf solche schleichenden Verspätungen zurückzuführen sind“, sagt Daniele Guidetti von der SBB.

„Mit diesem Wissen können die Planer das Fahrplangefüge anpassen und überlegen, wie kritische Stationspunkte anders gestaltet werden müssen.“ Ebenso ist auch die hundertprozentige vollständige Erfassung aller detektierten Verspätungen gewährleistet und hängt nicht mehr von Disponenten ab. Die Aussagekraft aller Messungen hat sich daher noch einmal massiv erhöht.

Weiterhin macht das System jetzt auch die Verkettungen durch Verspätungen bis hin in die Nachbarländer transparent. Wenn ein Zug verspätet abfährt, lassen sich die Auswirkungen dieser einen Verspätung in der Schweiz auf alle betroffenen Züge nachvollziehen. Bisher gab es nur eine Liste von betroffenen Verbindungen, die Folgen ließen sich aber nicht ohne weiteres ablesen. Noch ist die SBB aber nicht restlos zufrieden mit dem Gesamtsystem. „Das System läuft zwar sehr gut. Wir erreichen jedoch noch nicht die Qualität, die wir uns im Fachkonzept vorgenommen haben. Zum Beispiel bei den Algorithmen für die Verkettungen und bei der Beurteilung der möglichen Ursachen“, sagt Guidetti. „Wir wollen mit den Aussagen von EFA noch näher an die Wahrheit rankommen.“

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

(ID:47975599)