Frisch von der Open World aus London Oracle unterstützt Data Scientists in der Cloud
Anbieter zum Thema
Wer Oracle zum ersten Mal auf der „OpenWorld“ in London begegnet wäre, nähme wohl an, das Unternehmen hätte seine Software immer nur aus der Cloud vermarktet. Die Wolke war omnipräsent. Aktuell angekündigt wurden ein OCI-Azure-Interconnect-Zentrum in Amsterdam, eine Partnerschaft mit dem Colocation-Anbieter Equinix sowie eine in die OCI integrierte Infrastruktur für Data Scientists.

„Wir müssen das Thema Cloud überhaupt nicht vorantreiben; unsere Kunden treiben uns quasi vor sich her“, sagte Andrew Sutherland, Senior Vice President EMEA für die Oracle Cloud: „Die Kunden wollen Unternehmens-Workloads in der Cloud – mit der dafür notwendigen Sicherheit, Performance und Skalierbarkeit.“ Mehr noch: Sie wüssten mittlerweile, dass sie alle drei Faktoren in ausreichendem Maße nur in der Cloud haben könnten.
Als Alleinstellungsmerkmal seiner Oracle Cloud Infrastructure (OCI) sieht Oracle vor allem die Durchgängigkeit („Convergence“) seiner Daten-Management-Software. „Dass man eine separate Datenbanksoftware für unterschiedliche Techniken bräuchte, ist ein Mythos“, konstatierte Juan Loaiza, Executive Vice President für Mission-critical Database Technologies. Für den Anwender sei eine „konvergente“ und alle Spielarten umfassende Datenbank-Software wie die Oracle-eigene „Autonomous Database“ sicherer und einfacher zu handhaben als der „Horses-for-causes“-Ansatz anderer Anbieter.
Aufmerksame Zuhörer werden hier einen weiteren Seitenhieb gegen Amazon Web Services (AWS) herausgehört haben. AWS hat kürzlich alle seine Systeme von Oracle-Datenbanken auf seine eigenen DB-Produkte umgestellt. Von denen gibt es ein knappes Dutzend – angefangen von relationalen Systemen wie RDS, Aurora (für MySQL- und Postgres-Datenbanken) sowie Redshift (Data Warehouse) über InMemory-Speichersystemen bis zu hochspezialisierten Produkten für Diagramme oder Zeitreihen. Und weil AWS als Hyperscaler erster Güte einen beinahe übermächtigen Konkurrenten auf dem Cloud-Markt darstellt, ist Oracle nicht gerade gut auf ihn zu sprechen.
Viertes Interconnect-Zentrum in Westeuropa
Ganz anders die Beziehung zu Microsoft. Obwohl der Windows-Erfinder mit Azure ebenfalls ein Mitbewerber im Cloud-Sektor ist, zeigt sich Oracle ihm gegenüber von der kooperativen Seite: Schon im vergangenen Sommer gaben die beiden Anbieter bekannt, dass sie ihre Clouds für die Daten und Workloads der jeweils anderen Anwender öffnen wollen. Laut Sutherland kam Oracle damit einem Wunsch seiner Kunden nach.
Speziell für den Austausch zwischen OCI und Azure bestimmte „Interconnect“-Zentren stehen unter anderem in Frankfurt am Main und Zürich sowie London – und neuerdings auch in Amsterdam. Damit gibt es jetzt vier solcher Zentren in Westeuropa und davon zwei, die sich an den Datenschutzbestimmungen der EU orientieren.
Sicherheitsbedenken zählen für Sutherland aber ohnehin zu den „Cloud-Mythen, die bereits entschleiert wurden“. Vor wenigen Jahren hätten die Kunden ständig danach gefragt, heute sei das Thema vom Tisch. Für Unternehmen mit besonderen Datenschutz-Anforderungen offeriert Oracle ohnehin den Cloud-Betrieb vor Ort auf Exadata-Maschinen – unter dem Stichwort „Oracle Cloud at Customer“.
Eine eigene Umgebung für jeden Kunden
Aber auch in der Public Cloud könnten die Oracle-Kunden sicher sein, dass niemand unautorisiert auf ihre Daten zugreifen könne, versprach Loiza. Im Gegensatz zu anderen Cloud-Plattformen sei in der OCI-Gen2-Umgebung auch ein gehackter „Hypervisor“ noch keine Tragödie, denn Oracle schütze jeden seiner Cloud-Kunden mit einem „Hardware Secure Perimeter“. Im Klartext: Die Daten jedes Tenant laufen in einer eigenen physischen Umgebung, auf die nicht einmal Oracle Zugriff hat.
„Kein Code, den wir besitzen, darf auf demselben System laufen wie die Anwendungen der Kunden“, erläuterte Wim Coekaerts, Senior Vice President Software Development: „Sogar dann, wenn der Kunde beispielsweise will, dass wir auf seinen Speicher zugreifen, müssen wir ihm sagen, dass wir das nicht können.“
Colocation-Kunden sollen Zeit gewinnen
Einen neuen Großanwender der für OCI maßgeschneiderte „Exadata“-Hardware stellte Oracle in London ebenfalls vor: Equinix, einen Spezialisten für Colocation, der unter der Bezeichnung International Business Exchange (IBX) weltweit mehr als 200 Rechenzentren für knapp 10.000 Unternehmen betreibt. Equinix hat sich offenbar entschieden, den Kern seiner Datenbank-Transaktionen künftig auf Exadata-Maschinen zu betreiben.
Eigenen Angaben zufolge kann Equinix die Anwendungen seiner Kunden damit um durchschnittlich ein Drittel schneller fahren als zuvor. Für die Equinix-Kunden bedeutet das: vierfache Geschwindigkeit bei Analytics-Anwendungen und dreimal so rasche Datenreplikation – ganz zu schweigen von der noch weitaus größeren Zeitersparnis bei komplexen Datenbankabfragen.
Data Scientists kooperieren in der Cloud
Ein Thema, das Oracle auf der Open World ganz hoch oben aufgehängt hatte, war Artificial Intelligence (AI). Für den Anbieter gehören AI beziehungsweise Machine Learning (ML) und die Cloud unmittelbar zusammen. Nicht nur, dass die Selbstheilungs- und automatischen Update-Funktionen der Cloud-basierenden Autonomous Database auf ML-Algorithmen gründen. Vielmehr will der Softwareanbieter die Nutzung solcher Algorithmen auch seinen Kunden nahebringen.
Laut Oracle können die Unternehmen das Transformationspotential ihrer Daten heute kaum nutzen, weil die Data-Science-Teams weder auf die geeigneten Daten zugreifen können noch die richtigen Tools an der Hand haben. Deshalb würde es so lange dauern, bis die Modelle entwickelt seien – und dann entsprächen sie häufig gar nicht den Unternehmensanforderungen hinsichtlich Korrektheit und Robustheit. Folglich schafften es viele dieser Modelle nie bis zum Produktionsstatus.
Vor allem aber sind die notwendigen Data Scientists eine rare Spezies; sie gehören zu den am heißesten begehrten und am besten bezahlten Arbeitnehmern im gesamten IT-Bereich. Ihre Arbeit optimal zu unterstützen ist also gleichzeitig ein Schlüssel zum Unternehmenserfolg und eine Maßnahme zur Kostenoptimierung.
Das weiß auch Oracle. Zur Unterstützung der Data Scientists hat das kalifornische Softwareunternehmen soeben die Oracle Cloud Data Science Platform auf den Markt gebracht. Sie baut auf dem im Mai 2018 akquirierten Tool von DataScience.com auf, das bislang separat angeboten wurde. Jetzt ist es fest mit der OCI verbunden und wird von Oracle als ein Cloud-Service angeboten.
Teamarbeit bevorzugt
Die Data-Science-Infrastruktur soll den Oracle-Kunden helfen, ML-Modelle zu bauen, zu trainieren, zu managen und auszuliefern. Sie richtet sich nicht an einzelne Data Scientists, sondern unterstützt die Teamarbeit – durch Funktionen wie
- Shared Projects (Unterstützung von Versionskontrolle und Work Sharing);
- Modellkatalog (für das Teilen von fertigen Modellen sowie Artefakten für Modifizierung und Deployment);
- teamübergreifende Sicherheits-Policies (Kontrolle des Zugriffs auf Modelle, Funktionist integriert mit OCI Identity and Access Management);
- Reproduzierbarkeit und Nachverfolgung (Auditability).
Die zahlreichen Automatisierungsfunktionen der „Plattform“ sollen erfahrenen Data Scientists ermöglichen, sich auf die wirklich kniffligen Aufgaben zu konzentrieren. Unerfahrene Kollegen können damit aller Voraussicht nach deutlich schnellere und verlässlichere Ergebnisse erzielen. Die fraglichen Funktionen sind:
- „AutoML“, ein Tool, mit dem automatisch die am besten geeigneten Datasets für das Training von Modellen aufgebaut werden können. Auswahl und Tuning der Algorithmen sowie der Test-Prozess lassen sich mit diesem Feature beschleunigen und vereinfachen; es prüft die Korrektheit der Ergebnisse und bestätigt die Verwendung der optimalen Modelle und Konfigurationen.
- „Automated Predictive Feature Selection“ kann Schlüssel-Features für Vorhersagen aus größeren Datasets herausfiltern.
- „Model Evalution“ generiert eine Suite aus Metriken und Visualisierungen zur Leistungsüberwachung von Modellen bei der Verarbeitung von neuen Daten. Auf dieser Grundlage ist der Data Scientist in der Lage, ein Ranking verschiedener Modelle hinsichtlich ihres produktiven Verhaltens vorzunehmen . Diese Funktion geht weit über eine einfache Performance-Messung hinaus, indem sie das erwartete Verhalten unter dem Strich berechnet und ein Kostenmodell erstellt, mit dem sich auch die Auswirkungen von False Positives und False Negatives einschätzen lassen.
- „Modell Explanation“ ist entscheidend im Hinblick auf die derzeit viel diskutierte Ethik der AI: Ob Algorithmen gängige Vorurteile zementieren und ihre Anwendung bestimmte Menschengruppen benachteiligt, lässt sich nur beurteilen, wenn die einzelnen Bestandteile eines Modells transparent beschrieben sind.
(ID:46372228)