Datenanalysen für die Energiewende Data Analytics im Energiesektor und im Klimaschutz
Anbieter zum Thema
Die Energiewende stellt Energieversorger vor große Herausforderungen. Welche Rolle spielt Data Analytics, um die Transformation zu meistern und die Wettbewerbsfähigkeit zu steigern? Darüber hat BigData-Insider mit Benjamin Bohne gesprochen, Group Vice President Sales Central EMEA bei Cloudera.

Die Herausforderungen in der Transformation der Energiewirtschaft sind immens – und die Investitionen betragen nach Schätzungen von Analysten eine Billion US-Dollar pro Jahr. Die Projekte betreffen E-Fahrzeuge, Energieerzeugung und -verteilung, Grid-Optimierung und nicht zuletzt Nachhaltigkeit und Klimaschutz. Der Beitrag, den dabei Data Analytics leisten kann, ist nach Ansicht von Cloudera von wesentlicher Bedeutung für die Entwicklung solcher Projekte, auch für Endverbraucher. Cloudera verfügt über eine umfassende Analytics-Plattform namens CDP, die in der Cloud betrieben wird.
„Bei unseren Kunden aus dem Energiesektor sind derzeit vor allem Analytics-Lösungen für den Smart-Grid-Bereich gefragt“, berichtet Benjamin Bohne, Group Vice President Sales Central EMEA bei Cloudera. „Das ist nicht verwunderlich, denn intelligente Stromzähler erzeugen riesige Mengen an Daten, deren Auswertung großes Potenzial bietet. Energieversorger können damit zum Beispiel Verbrauchsmuster erkennen, die Energieverteilung optimieren und ihren Ressourcenpool möglichst effizient nutzen. Anhand von Datenanalysen gewinnen sie einen 360-Grad-Blick auf den Kunden, um Marketing, Vertrieb und Kundenservice zu verbessern. Indem Unternehmen verstehen, welche Konsumbedürfnisse der einzelne Verbraucher hat, können sie ihm individuelle Angebote machen und eine optimale Customer Experience schaffen.“ Bohne nennt als Erfolgsbeispiel das spanische Unternehmen Podo.
Energiesparen in Spanien
Der spanische Energieversorger Podo hat mit Cloudera eine Cloud-basierte Plattform für maschinelles Lernen und fortschrittliche Analysen entwickelt. Diese wertet mit intelligenten Algorithmen binnen Sekunden über 40 Milliarden Datensätze sowie Streaming-Daten von intelligenten Zählern und angeschlossenen Geräten aus. Dadurch kann das Unternehmen den individuellen Stromverbrauch jedes einzelnen Kunden in ganz Spanien vorhersagen.
Der Vorteil: Wer einen Stromvertrag mit Podo abschließt, erhält einen individuellen Tarif, der genau auf sein Konsumverhalten zugeschnitten ist. In einer App kann der Kunde dann seinen Verbrauch einsehen und bekommt Tipps, wie er sparen kann – etwa zu welchen Zeiten die Energie günstiger ist und wie er Strom sparen kann.
„Das Machine-Learning-System verbessert laufend seine Treffsicherheit, je mehr frische Daten eintreffen“, sagt Alberto Hernández Seco, Technology Manager für Podo. „Es ist mittlerweile zehn Mal treffsicherer als zuvor, als wir ohne Cloudera arbeiteten. Unsere Fehlerquote liegt bei unter einem Prozent.“ Die Lösung habe dazu beigetragen, dass Endverbraucher und Unternehmen ihre Stromkosten um bis zu 30 Prozent verringern konnten.
Bei Podo laufe Cloudera auf der Google Cloud Platform in einem skalierbaren Cluster, der rund 14 Terabyte umfasse: historische Kundendaten, IoT-Daten von Lampen und Stromzählern, externe Datenbanken für Statistiken der Regierung sowie Grundbesitzangaben. Cloudera Enterprise führt die Workloads mit seiner Analytics Database aus. Als analytische Werkzeuge dienen R, Python und Matlab, aber auch Apache Spark und Apache Impala.
Seco weiter: „Diese Plattform hat uns erlaubt, den Zugang zu Datenanalysen zu demokratisieren und das Denken über Big Data im ganzen Unternehmen zu etablieren, sodass heute keine Entscheidung mehr gefällt wird, ohne dass sie durch aus der Plattform extrahierte Daten gestützt wird.“
„Unser Kernprodukt ist die Cloudera Data Plattform (CDP)“, erläutert Bohne. „Sie ermöglicht es, riesige Datenmengen aus verschiedenen Quellen und in verschiedenen Formaten zu sammeln, in einem Big Data Lakehouse zu speichern, KI-gestützt auszuwerten und bereitzustellen.“ Nur mit Cloud-Technologie lasse sich dies in der Geschwindigkeit, Skalierbarkeit, Flexibilität und Nutzerfreundlichkeit bewerkstelligen.
„Entscheidend ist, dass Kunden mit unserer Plattform frei wählen können, wo sie ihre Daten hosten wollen“, so Bohne weiter. „Die CDP funktioniert mit beliebigen Clouds und bietet ein einheitliches Datenmanagement sowohl für On-Premises-Systeme als auch Private Clouds und Public Clouds.“ So ließen sich Daten problemlos zwischen verschiedenen Umgebungen verschieben. Die CDP unterstütze agentenbasierte Modellierung mit Apache Spark und könne Millionen von Datenzeilen innerhalb von Sekunden analysieren.
Petabyte-Analysen in China
Bohne nennt als weiteres Kundenbeispiel die „Chinese Research Academy of Environmental Sciences“ (CRAES). Das staatliche Institut nutzt Cloudera, um Petabyte an Emissionsdaten aus dem Schwerkraftverkehr zu monitoren. Die Organisation ist zuständig für die Umweltverträglichkeit von Fahrzeugen in der Volksrepublik China, was auch die Technik zur Überwachung von Emissionen sowie die Unterstützung entsprechender Richtlinien umfasst. Denn schon 2018 beschloss das Ministerium für Ökologie und Umweltschutz (MEE) den Emissionsstandard China VI für Schwerlastfahrzeuge (HDVs, weil Schwerlastfahrzeuge rund die Hälfte aller Treibhausgase ausstoßen, die von allen Fahrzeugtypen in China erzeugt werden, sowie drei Prozent aller Treibhausgase, die die Industrie ausstößt.
CRAES erfasst Emissionsdaten in Echtzeit, was rasch zu einer Herausforderung für die bestehende Datenplattform führte, die nicht mehr Terabyte, sondern Petabyte speichern und auswerten musste. Zudem mussten die IT-Mitarbeiter die Analysevorgänge und die Plattformverwaltung selbst vornehmen, was zu einem Personalaufwand führte. Im Jahr 2022 wandte sich CRAES an Cloudera.
Nun ist die CRAES-IT-Plattform in der Lage, Petabyte an Daten auf der CDP zu speichern, wertet sie aus und macht sie für alle Stakeholder in einem Fernkontrollsystem verfügbar. Daraus lassen sich fundiert Empfehlungen für Emissionsminderungen in der Volksrepublik ableiten. Der Standard forderte Partikelfilter sowie Bordinstrumente für die Emissionsüberwachung, also Terminals für den Datenfernabruf. Diese mussten laut Standard China VI (s. o.) bis 2021 an Bord aller neuen Diesel-Fahrzeuge (HDVs) eingebaut sein. Mithilfe Cloudera konnte CRAES auch seine Personalkosten beträchtlich eindämmen.
„Unser Ziel war es, eine bessere Methode zu finden, um große Datenmengen zu sammeln und auszuwerten“, sagt Bai Tao, Senior Manager, Information Data Department im Vehicle Emission Control Center beim CRAES. „Wir wählten die Cloudera Data Plattform (CDP) wegen ihrer Fähigkeit, Datenmanagement und Kosteneffizienz zu verbessern.“ Das CRAES plant, diese Fähigkeiten der CDP auch auf andere Typen von Maschinen anzuwenden.
Komplexe Energienetze
In einem komplexen Energy Grid, der alle Arten von erneuerbaren Energien sowie weit verteilte Abnehmer wie etwa E-Fahrzeuge umfasst, müssen Nachfrage und Angebot laufend neu berechnet und vorhergesagt werden. Deshalb stehen die Grid-Manager einer großen Herausforderung gegenüber: Wie schnell können sie Nachfrage und Angebot in Echtzeit berechnen und dafür planen? Mit anderen Worten: Wie viele Millionen Simulationen schafft eine Analytics-Plattform wie Cloudera CDP in der Cloud pro Stunde?
Benjamin Bohne antwortet: „Ich bin geneigt zu antworten ,beliebig viele‘, was aber wenig sinnvoll ist, ohne zu wissen, wie komplex die Berechnung einer einzelnen Simulation ist – abhängig von Daten, Algorithmen, Setup und Parameter kann eine Simulation eine Hundertstelsekunde oder eine Woche dauern. Meiner Erfahrung nach liegt die Einschränkung jedoch eher auf der Kosten- als auf der Berechnungsseite.“
Vereinfacht lasse sich sagen: „Wir können technisch mehr Simulationen pro Sekunde ausführen als Kunden bisher brauchten“, so Bohne. „Die Frage lautet also nicht ,geht es?‘, sondern ergibt es logisch und wirtschaftlich Sinn – wird also die Vorhersage besser – und wie viel Rechenleistung möchte der Kunde nutzen und bezahlen?“ Das gelte natürlich auch für andere Branchen, etwa bei Finanzinstituten, die umfangreiche Simulationen für die Geldwäschebekämpfung oder bei Intraday-Risikoberechnungen durchführen.
Nachhaltigkeit
Wie zahlreiche andere Unternehmen ist auch Cloudera bestrebt, selbst klimaneutral zu werden. Das ist leichter gesagt als getan, denn nun muss Cloudera zuerst Analysen an sich selbst ausführen und die Erkenntnisse in geeignete Maßnahmen in den Score-Bereichen 1 bis 3 realisieren, also bis in das Partner-Ökosystem hinein. Im Sustainability Report großer Unternehmen wie SAP oder Microsoft lassen sich die entsprechenden Kennzahlen jeweils nachlesen.
„Cloudera hat sich zum Ziel gesetzt, bis 2050 klimaneutral zu sein“, berichtet Bohne. „Wir gehen davon aus, dass unsere CO2-Emissionen in den nächsten fünf Jahren im Vergleich zu 2019 um 26 Prozent sinken werden. Dafür haben wir bereits eine Reihe von Maßnahmen umgesetzt, zum Beispiel Lichtsteuerungen in Arbeitsbereichen und Konferenzräumen, LED-Beleuchtung für alle Neubauten sowie Recycling- und Abfallmanagement-Programme.“
Als Reaktion auf die Corona-Pandemie setze Cloudera zudem stark auf Remote Work und habe Dienstreisen reduziert. „Künftig streben wir noch weitere Maßnahmen an“, so Bohne weiter. „So wollen wir uns zum Beispiel für noch mehr Umweltschutz in unserer Organisation engagieren und unseren Verbrauch von Energie, Wasser, Papier und andere Ressourcen managen. Umweltaspekte sollen künftig in alle Beschaffungsaspekte einbezogen werden.“ Die Erfahrung hat gezeigt, dass allein schon das Wasser-Management für ein großes Datenaufkommen im Projekt sorgen dürfte, das nur mit entsprechenden Analysen und Operativer Technologie (OT) bewältigen und real umzusetzen ist.
(ID:49318228)