Nachbericht Teradata Possible 2024 Teradata stellt neue KI-Funktionen in ClearScape Analytics vor

Von Michael Matzer 7 min Lesedauer

Anbieter zum Thema

Neue Funktionen in ClearScape Analytics sollen die Produktivität von Data Scientists fördern und Unternehmen bei der schnellen Amortisierung von KI/ML-Investitionen unterstützen. In diese Suite werden auch quelloffene Tools wie KNIME integriert und Apache Spark angekoppelt.

Das Publikum lauschte auf der Anwenderkonferenz Teradata Possible 2024 mehreren Diskussionen auf der Bühne. (Bild:  Teradata)
Das Publikum lauschte auf der Anwenderkonferenz Teradata Possible 2024 mehreren Diskussionen auf der Bühne.
(Bild: Teradata)

Teradata hat auf seiner Kundenkonferenz „Possible 2024“ in London neue Funktionen in seiner Analytik-Suite „ClearScape Analytics“ angekündigt. Diese sollen Data Scientists dabei helfen, produktiver zu arbeiten und schneller relevante Ergebnisse zu liefern. Gleichzeitig würden Unternehmen dabei unterstützt, ihre Innovationen in Künstliche Intelligenz und Machine Learning schneller zu amortisieren.

Alle Teradata-VantageCloud-Kunden haben Zugriff auf ClearScape Analytics und die neuen Funktionen. Teradatas Bestreben sei es, seinen Kunden eine performante, integrierte, aber vor allem sichere Ausführungsumgebung für alle Aufgaben bereitzustellen, die für Advanced Analytics, Künstliche Intelligenz und Machine Learning benötigt werden.

Steve McMillan, Chief Executive Officer bei Teradata(Bild:  Teradata)
Steve McMillan, Chief Executive Officer bei Teradata
(Bild: Teradata)

Nur die Sicherheit dieser Plattform könne das Vertrauen in die verwendeten Daten und KI-Apps gewährleisten, sagten CEO Steve McMillan und seine Manager wie ein Mantra. Denn Vertrauen, so der Tenor vonseiten der Kunden, sei das höchste Gut, das es in den Interaktionen mit den Kunden zu bewahren und zu bestätigen gelte. Das Stichwort lautet „Customer Experience“ (CX). Teradata garantiere die Sicherheit der Daten und Prozesse, aber auch der Machine-Learning- und KI-Modelle. Dass Teradata durch seine Philosophie „Bring your own model“ (s. u.) damit auf einem schmalen Grat wandelt, stellt die beanspruchten Fähigkeiten auf die Probe.

Die neuen ClearScape-Analytics-Funktionen

Apache Spark wird nun für ClearScape Analytics als verbreitete Datenquelle angezapft. „Mit dem Teradata-Tool ,pyspark2teradataml‘ wird bestehender Pyspark-Code (aus Python und Scala) einfach in Teradata Machine Learning konvertiert, ohne dass Daten exportiert werden müssen, und das vermeidet fehleranfälliges Refactoring“, sagte Chris Hillman, Senior Director für den Bereich KI/Machine Learning International bei Teradata.

„Die Vorteile lassen sich wie folgt zusammenfassen“, so Hillman: „Vor allem Reduzierung von Komplexität und Kosten, denn Kunden, die bisher Daten von VantageCloud zu Spark-Plattformen exportieren mussten, müssen diese kostspielige und mühsame Aufgabe nicht mehr durchführen. Sie können mit konvertiertem Code in ClearScape Analytics arbeiten.“

Außerdem betrifft diese Koppelung den Einsatz von KI in großen Umgebungen, die nun mal vielfach auf Spark laufen. Spark unterstützt unter anderem Streaming-Daten, einen Data Lake sowie Machine Learning. „Nach der Konvertierung können Kunden das unternehmensgerechte Workload-Management, die Sicherheit und die Datenintegration von VantageCloud nutzen, um KI/ML-Modelle in großem Umfang schnell einzusetzen“, so Hillman.

Das neue Tool erlaubt auch den Einsatz von Multi-Cloud-Machine-Learning. „Kunden können nach der Konvertierung in einer Hybrid-Cloud-Umgebung arbeiten, damit sie ihre Spark-basierte Investition optimal nutzen können“, erläutert Hillman. Denn ein Data Lake in Spark ist vor allem in Enterprise-Umgebungen zu finden. Mit VantageCloud Lake bietet Teradata ein eigenes Data Lakehouse an, das in der Lage ist, offene Tabellenformate wie Apache Iceberg und Delta zu verarbeiten.

AutoML

Die neue Funktion AutoML sei entwickelt worden, damit Data Scientists automatisch Modelle trainieren können, die auf die Anforderungen und Ziele ihres Unternehmens zugeschnitten sind. „Das spart vor allem viel Zeit“, so Hillman, „erlaubt aber auch die Wahl des am besten geeigneten Algorithmus.“

Durch AutoML werde auch die Anwendergruppe erweitert, denn durch die Automatisierung des Modelltrainings ist die zeitaufwendige manuelle Arbeit im ML-Prozess nicht mehr nötig. Das ermöglicht es auch nicht-technischen Anwendern, KI/ML-Modelle zu erstellen. Die nächste Neuerung zielt auf die gleiche Anwendergruppe.

KNIME-Integration

KNIME ist eine vollständige No-Code- und Low-Code-Plattform, die es Anwendern ermöglicht, Data Science Workflows zu erstellen. Diese ist in Teradata VantageCloud und ClearScape Analytics integriert. KNIME soll die schnellere Umsetzung von KI-Initiativen erlauben und die bisherige Teradata-Anwendergruppe erweitern. Denn die quelloffene Plattform, die 300.000 Anwender in über 60 Ländern zählt, visualisiert sämtliche Workflows selbst für komplexe Daten- und KI-Aufgaben.

Die intuitiv verständliche Benutzeroberfläche soll es auch Wirtschaftsanalytikern erlauben, genau wie Data-Science-Profis, Big Data zu analysieren und KI-Apps zu erstellen. Dabei gewährleistet KNIME, das an der Uni Konstanz entwickelt wurde, dass alle Entitäten sicher und alle Modelle nachvollziehbare und transparent seien. Modelle würden validiert und überwacht, Ergebnisse wie etwa Aussagen würden verifiziert und erklärt. Die Sparkasse KölnBonn setzt KNIME mit gutem Erfolg in ihren Marketingkampagnen ein.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

„ClearScape-Analytics-Nutzer erhalten mit KNIME eine kostenlose, quelloffene No-Code-Schnittstelle, die für eine Vielzahl von technischen und nichttechnischen Benutzern geeignet ist“, so Hillman. „KI-Initiativen können durch die Einfachheit von KNIME und der Skalierbarkeit von VantageCloud beschleunigt werden.“

Neue Self-Service-UX-Verbesserungen

Neue Widgets wie etwa Schaltflächen sollen eine Self-Service-Nutzererfahrung für den Zugriff auf eine Vielzahl von Abfragen und Plots ermöglichen. Sie sollen die Benutzerfreundlichkeit von ClearScape erhöhen, Self-Service-Funktionen sollen die Fehler reduzieren, die Nutzer machen können. „Benutzer können auf ihre Daten zugreifen, ohne sie coden zu müssen, wodurch das Risiko von fehlerhaftem Code verringert wird“, so Hillman. Diese Neuerung ergänzt offenkundig die Low- & No-Code-Plattform KNIME.

Teradata Open-Source ML

ClearScape-Analytics-Benutzer können beliebte Open-Source-Funktionen für maschinelles Lernen auf VantageCloud ausführen. Das soll die Nutzung von Open-Source-Funktionen auf VantageCloud vereinfachen, die Skalierbarkeit und Performance für Open-Source-Funktionen und Einsatz von trainierten Open-Source-Modellen, die in VantageCloud gespeichert sind, erhöhen. Open-Source-Plattformen, die Teradata unterstützt, sind HuggingFace und GitHub.

Neue KI/ML-Funktionen für Data Scientists

Hillary Ashton ist Chief Product Officer bei Teradata. Ashton hat Teradatas KI-Strategie formuliert.(Bild:  Teradata)
Hillary Ashton ist Chief Product Officer bei Teradata. Ashton hat Teradatas KI-Strategie formuliert.
(Bild: Teradata)

„In den letzten Jahren haben immer komplexere KI-Tools und -Plattformen mit einer steigenden Anzahl an unterschiedlichen Daten- und Analyseplattformen zu komplizierten und ineffizienten KI/ML-Prozessen geführt“, beklagt Chief Product Officer Hilary Ashton. „Infolgedessen wird es für Unternehmen immer schwieriger, zuverlässige Erkenntnisse aus ihren Daten zu gewinnen und die Kosten für KI-Investitionen gering zu halten.“ Gleichzeitig stünden Data Scientists unter wachsendem Druck, ihren KI-Output zu steigern. Dies bestätigen aktuelle Marktstudien: Die Budgetgeber für KI-Projekte erwarten positive Ergebnisse binnen spätestens zwölf Monaten, wie das Institut „NewtonX“ herausfand. Es fand auch heraus, dass diese Budgetgeber zwar eine Business-Strategie haben, ihre KI-Strategie sich damit aber nicht im Einklang befindet.

„Leider wird die Produktivität von Data Scientists häufig durch ineffiziente Datenaufbereitung und manuelle Prozesse bei maschinellem Lernen beeinträchtigt“, so Ashton weiter. „Dies wird durch die steile Lernkurve verschärft, die mit den sich schnell entwickelnden Tools und Techniken der Branche einhergeht.“ Mit den genannten erweiterten Funktionen von ClearScape Analytics begegne Teradata genau diesen Herausforderungen und ermögliche seinen Kunden, bestehendes KI-Potenzial voll auszuschöpfen.

Damit KI-Nutzer auch externe, abgesicherte Datenquellen für ihre Modelle anzapfen können, umfasst die Teradata-Plattform bereits einen Vector Data Store, also eine Vektor-Datenbank, wie man sie in anderen Plattformen wie Snowflake oder Databricks vorfindet. So wird Retrieval Augmented Generation (RAG) beschleunigt, ebenso semantische Suche. Will der KI-Nutzer nicht nur ein LLM nutzen, kann er unter vielen verschiedenen LLMs und kleinen Sprachmodellen (SLMs) wählen, sondern auch sein eigenes angepasstes Modell mitbringen und auf der Teradata-Plattform gesichert ausführen lassen. „Wir unterstützen das ONNX-Format, damit User ihre Modelle untereinander austauschen und auf andere Anwendungsgebiete übertragen können“, berichtet Hillman. Um eine Vielzahl von Modellen, die ständig per RAG aktualisiert werden, zu verwalten, liefert Teradata eine ModelOps-Umgebung mit. Diese soll zu einer ModelOps-Workbench ausgebaut werden.

Dan Spurling, Senior Vice President Product Management bei Teradata(Bild:  Teradata)
Dan Spurling, Senior Vice President Product Management bei Teradata
(Bild: Teradata)

„Wir haben ClearScape Analytics vor fast zwei Jahren auf den Markt gebracht, um unseren Kunden zu helfen, den Wert ihrer Daten zu maximieren, Innovationen zu ermöglichen und die Komplexität von KI zu bewältigen“, sagt Daniel Spurling, Senior Vice President, Product Management bei Teradata. „Mit diesen jüngsten Erweiterungen unterstützen wir Data Scientists dabei, komplexe Prozesse durch verschiedene Self-Service- und automatisierte Funktionen zu optimieren. Dadurch können KI-Modelle schneller und kostengünstiger vom Training zum unternehmensweiten Einsatz kommen.“

KI auf der Kippe?

Der aktuelle Gartner-Hype-Cycle sieht das Thema „Generative AI“ auf dem Weg ins „Tal der Enttäuschungen“.(Bild:  Gartner)
Der aktuelle Gartner-Hype-Cycle sieht das Thema „Generative AI“ auf dem Weg ins „Tal der Enttäuschungen“.
(Bild: Gartner)

Im Gespräch mit CEO Steve McMillan zeigt sich, dass die KI-Nutzung weltweit an einem Scheideweg angelangt ist, denn die Tage des GPT-Hypes sind offenbar vorüber. „Wir sehen Verzögerung bei den Investitionen durch Kunden“, berichtet der CEO. „Und was ihre KI-Strategie anbelangt, zeigen sich einige Kunden unsicher.“ Der Grund ist nicht nur das mangelnde Vertrauen in KI-Modelle, die „halluzinieren“, sondern auch in eigene Fähigkeit, tausende von Modellen auszurollen, zu skalieren und zu verwalten. „Dieses Vertrauen auf allen Seiten hat Vorrang.“

„Der Trend ist, erst einmal einen Chatbot zu erstellen, um die Effizienz von Abläufen und die Produktivität von Mitarbeiter zu erhöhen.“ Über kurz oder lang werde aber kein KI-Nutzer daran vorbeikommen, KI-Apps in die eigenen Prozesse einzubetten. Die Voraussetzungen seien vorhanden: Function Model Embeddings und Vector Embeddings. „Das passiert bei der Bank of Australia in großem Umfang“, so McMillan: „In der Beratung, im Callcenter, im Multicannel-Vertrieb, in der Interaktion mit Kunden und in der Erstellung von Chatbots.“ Dabei ließe aber auch Predictive AI mit Generative AI sinnvoll kombinieren. Dass Teradata AI Unlimited als Daten-Engine in MS Fabric integriert worden sei, wertet McMillan als Beleg für die Notwendigkeit eines solchen Angebots.

McMillan sieht nicht zuletzt den Aspekt der Nachhaltigkeit im Hinblick auf KI-Nutzung. „Es muss nicht immer eine stromhungrige GPU sein“, erläutert er, „denn durch unsere massiv parallele Daten-Engine sind wir in der Lage, einen bestehenden CPU-Cluster zu verwenden, um performant KI-Modelle und Machine Learning auf bestehender Infrastruktur auszuführen. Die Workloads werden orchestriert und die Abfragen optimiert.

Das komme besonders On-premises-Architekturen zugute, die heute in regulierten Branchen wie den Banken immer noch 70 Prozent der Infrastruktur ausmachen. Die Cloud wird hier wegen der Burst-Option genutzt: Sie stellt bei Bedarf zusätzliche Rechen- und Speicherkapazitäten zur Verfügung.“ Weil die Cloud für manche Kunden zunehmend attraktiv sei, erwirtschafte Teradata ein bedeutenden Umsatz mit VantageCloud: „Über die letzten vier Jahre waren das 550 Millionen US-Dollar an wiederkehrendem Umsatz.“

(ID:50179812)