Kommentar von Niklas Bläsing, CGI Auf dem richtigen Weg zur betriebsbereiten KI

Von Niklas Bläsing 5 min Lesedauer

Anbieter zum Thema

Viele neue Trends haben das Jahr 2023 bestimmt. Der Siegeszug der generativen Künstlichen Intelligenz (KI) war dabei wahrscheinlich die wichtigste Entwicklung. In der Folge evaluieren etliche Unternehmen eigene Anwendungsmöglichkeiten. In einem volatilen KI-Markt mit verschiedenen Lösungen und Betriebsmodellen ist aber die Entscheidung für die richtige Variante nicht einfach. Die Betrachtung der jeweiligen Vor- und Nachteile liefert eine erste Entscheidungshilfe.

Der Autor: Niklas Bläsing ist Executive Consultant, Practice Head Data, Automation & AI bei CGI in Deutschland(Bild:  CGI)
Der Autor: Niklas Bläsing ist Executive Consultant, Practice Head Data, Automation & AI bei CGI in Deutschland
(Bild: CGI)

Immer mehr Unternehmen erwägen nach der Erfolgsgeschichte von ChatGPT den Einsatz generativer KI-Systeme. Sie stehen dabei vor mehreren Fragen: Open Source oder proprietäre Lösung, On-Premises oder Cloud-Einsatz, Eigenentwicklung oder Nutzung einer vorhandenen Lösung? Eine einfache Antwort auf diese Fragen gibt es jedoch nicht. Die Wahl der richtigen Variante hängt von den konkreten Unternehmensanforderungen ab.

Die erste Voraussetzung für eine erfolgreiche Durchführung eines KI-Projektes sind die Daten, die in entsprechender Quantität und Qualität zur Verfügung stehen müssen. Die Aufgabe für Unternehmen besteht darin, die Daten auszuwählen und aufzubereiten, damit sie für das Training der KI nutzbar sind. In der Regel können viele Unternehmen dabei auf eigene große Datenbanken und Data Lakes zugreifen. Als zusätzliche Input-Möglichkeit für Daten ist das Data Scraping einsetzbar, etwa um Informationen aus dem Internet oder Intranet auszulesen.

Ist das Thema Datenmanagement geklärt, muss ein Unternehmen entscheiden, ob es auf vorhandene KI-Lösungen zugreifen will oder eine Eigenentwicklung startet. Ein „From-Scratch“-Ansatz ist dabei meist nicht sinnvoll, vor allem aufgrund des Aufwandes, der Komplexität und der Kosten. Eine Ausnahme mag für Organisationen gelten, die in einem sehr spezifischen Segment wie zum Beispiel der Aerodynamik tätig sind, für das keine klassischen KI-Modelle nutzbar sind. Eigenentwicklungen sind deshalb eher im Bereich der Forschung von Vorteil.

KI und die Cloud

Im Hinblick auf einen KI-Einsatz im On-Premises- oder Cloud-Betrieb ist zu beachten, dass die datenintensiven Workloads einer KI-Umgebung hohe Anforderungen an die Infrastruktur stellen. Das betrifft zum Beispiel die Hardware mit extrem kostspieligen GPUs (Graphics Processing Units). Viel spricht deshalb für die Cloud etwa mit der Nutzung eines „Pay per use“-Modells. Muss ein Unternehmen allerdings hohe regulatorische Compliance-Vorgaben erfüllen, ist eine hybride Umgebung die beste Wahl, also mit einem KI-Mischbetrieb: on-premises für vertrauliche Daten wie Finanzberichte und Kundenpräsentationen und in der Cloud für unkritische Daten. Generell ist aber im KI-Bereich oft der beste Weg, das Training in der Cloud – etwa auch mit anonymisierten beziehungsweise synthetischen Daten – durchzuführen mit anschließender Nutzung des KI-Modells in der On-Premises-Umgebung, zum Beispiel an der Edge einer Fertigungsstraße.

Die Vorteile von Open Source und proprietären Lösungen

Die Entscheidung, ob ein Unternehmen eine Open-Source- oder eine lizenzierte proprietäre Lösung verwendet, muss individuell getroffen werden, unter Abwägung der jeweiligen Vorteile und Betrachtung der Anwendungsfälle.

Bei den lizenzierten Modellen können Unternehmen etwa Microsoft Azure OpenAI oder Anthropic Claude über AWS und Google Cloud nutzen. Gerade im Hinblick auf das Thema digitale Souveränität dürfte auch das Heidelberger Unternehmen Aleph Alpha auf europäischer Ebene an Relevanz gewinnen.

Der entscheidende Vorteil der proprietären Varianten ist die Usability. Sie bieten ein Cockpit, das ein einfaches Einlesen von Trainingsdaten ermöglicht, bei Open Source hingegen steht nur Code zur Verfügung. Open-Source-Lösungen wie Llama 2 allerdings können durch eine große Community-Mitarbeit punkten, die das Feintuning der Lösungen konsequent vorantreibt. Auch wenn ein Unternehmen eine maximale Unabhängigkeit und Gestaltungsfreiheit beim KI-Einsatz behalten will, sollte es eine Open-Source-Variante wählen. Bei der Nutzung von Open-Source-Modellen ist aber auch der Kostenfaktor zur berücksichtigen, schließlich müssen eigene Server betrieben werden.

Prinzipiell kann man festhalten: Will ein Unternehmen einen proprietären, vertraulichen Code generieren, sollte es eine Open-Source-Lösung mit vielen Feintuning-Möglichkeiten im eigenen Rechenzentrum nutzen. Für einen einfachen FAQ-Chatbot hingegen bietet sich eher ein bewährtes „Pay per use“-Modell in der Cloud an.

RAG als nächster Schritt

Beim KI-Einsatz dominieren momentan Large Language Models (LLMs) wie ChatGPT, die bereits äußerst leistungsfähig sind. Sie sind auf große Datenmengen trainiert, um ein breites Spektrum an Allgemeinwissen abzudecken. Wenn ein LLM jedoch aufgefordert wird, eine Antwort zu generieren, die ein nicht in seinen Trainingsdaten enthaltenes Wissen erfordert, kommt es an seine Grenzen. Das Ergebnis können dann auch objektiv falsche KI-Antworten sein, sogenannte Halluzinationen. Mit dem Konzept Retrieval-Augmented Generation (RAG) können diese Probleme vermieden werden. RAG stellt den LLMs zusätzliche Informationen aus externen Wissensquellen wie Vektordatenbanken zur Verfügung. Dadurch können die LLMs exaktere und kontextbezogene Antworten generieren und zugleich Halluzinationen reduzieren.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Aktueller Stand und Vision

Vor allem im Bereich Manufacturing spielt KI bereits eine wichtige Rolle: Durch die Nutzung von Sensoren und die Auswertung von IoT-Daten werden Fertigungsprozesse effizienter gestaltet, etwa durch die vorausschauende Wartung oder die Qualitätssicherung. Aber auch hier gibt es noch ein großes Optimierungspotenzial. So kann KI durchgängig auf die gesamte Prozesskette angewendet werden, zum Beispiel bis hin zu einer automatisierten Bestellung fehlenden Materials.

Bei jedem KI-Einsatz sollten Unternehmen deshalb immer eine Roadmap festlegen und eine Vision verfolgen. Auch wenn derzeit bevorzugt intelligente Chatbots und Chat-Interfaces genutzt werden, muss klar sein: Sie sind längst nicht das Ende der KI-Fahnenstange, sondern vielmehr nur ein kleiner Anfang. Wichtig ist vor allem eine Verknüpfung der Prozess- mit der KI-Welt. Mit einer Verankerung der KI in zentralen Prozessen können viele manuelle Abläufe beseitigt und Medien- wie Prozessbrüche vermieden werden, sodass Unternehmen unmittelbar einen Mehrwert generieren können.

Insgesamt betrachtet ist momentan im KI-Bereich viel in Bewegung, es werden noch etliche neue Lösungen sowohl von großen Playern wie Google oder der Meta-Gruppe als auch von kleineren Anbietern mit branchenspezifischem Fokus auf den Markt kommen. Unternehmen können im Hinblick hierauf aber keine abwartende Haltung einnehmen. Nur wenn sie sich frühzeitig mit KI-Anwendungen befassen, werden sie im Wettbewerb nicht ins Hintertreffen geraten. Es muss auch nicht immer das neueste KI-Topmodell sein. Bereits die vorhandenen Lösungen bieten ein Potenzial, das vielfach noch nicht ausgeschöpft wird.

Die Empfehlung lautet folglich: Ein Unternehmen sollte heute im Hinblick auf Zukunftssicherheit, Unabhängigkeit und Flexibilität eine Architektur wählen, die es ermöglicht, Modelle künftig auszutauschen. Das RAG-Konzept mit der Speicherung von Daten in einer Vektordatenbank ist dafür ein gutes Beispiel. Das darüber liegende Modell ist dann jederzeit austauschbar.

Artikelfiles und Artikellinks

Link: CGI im Web

(ID:49916730)