Nvidia hat mit NeMo Guardrails ein Open Source Toolkit vorgestellt, mit dem jedes Large Language Model (LLM) – wie etwa ChatGPT oder Nvidia NeMo – mit einer zusätzlichen „Schutzschicht“ versehen werden kann. Diese Schutzschicht kann jeder Nutzer dazu verwenden, die Interaktion mit einem LLM und die Ergebnisse eines LLMs mithilfe von Regeln zu programmieren, die in Python geschrieben sind.
Eine schematische Darstellung des Frameworks, das NeMo Guardrails bildet.
(Bild: Nvidia)
Nvidia bietet mit NeMo Framework ein LLM an, das eine Vielfalt von Aufgaben erfüllen kann und ChatGPT von OpenAI in nichts nachsteht. Im Bereich der Automatic Speech Regocnition (ASR), der Text-in-Sprache-Umwandlung und der maschinellen Übersetzung umfasst dieses LLM zahlreiche Funktionen. NeMo LLM ist aber auch ein Dienst, mit dem große Sprachmodelle, die auf mehreren Frameworks trainiert wurden, schnell angepasst und verwendet werden können.
Entwickler können KI-Anwendungen für Unternehmen mit NeMo LLM in privaten und öffentlichen Clouds bereitstellen. Außerdem können sie Megatron 530B, eines der größten Sprachmodelle, über den LLM-Dienst NeMo erleben.
NeMo Guardrails erlaubt einem Entwickler die programmierte Regelung von drei Funktionsbereichen in der Nutzung eines LLM: interne Themen, Halluzinationen und themenbezogene Gefahren wie etwa Hate Speech, schließlich Security hinsichtlich Identitäts- und Datenmissbrauch.
KI-Halluzinationen
Als Nvidia Vice President Jonathan Cohen seinen neuen Service NeMo Guardrails vorstellte, bezog er sich mehrfach auf KI-Halluzinationen. Diese sollen von Guardrails aufgedeckt, vermieden und verhindert werden, denn sie können eine fatale, manipulative Wirkung entfalten, vom unnötigen Energieverbrauch ganz abgesehen.
Seit etwa 2018 zeigt die Verwendung von LLMs – und ganz besonders von ChatGPT, dass die Modelle unsinnige Antworten liefern, sich ihre eigenen Wahrheiten und Fakten zusammenphantasieren und sogar darauf insistieren, dass sie richtig liegen. Dieses Phänomen der generativen KI wird „Halluzinationen“ genannt.
Sie sind indes kein psychologisches Phänomen, sondern beruhen auf technischen Mängeln. Es kann erstens datenbasierte Halluzinationen geben: Diese sind auf Widersprüche und Abweichungen in den Datenquellen zurückzuführen, besonders wenn die Menge von Trainingsdaten sehr umfangreich ist.
Im zweiten Fall können die Trainingsdaten noch so wenig Abweichungen aufweichen, es kommt dennoch zu Halluzinationen. Das Problem liegt in der Trainingsmethode. Das kann an einer fehlerhaften Dekodierung im sogenannten Transformer, einem ML-Modell, liegen. Oder an einem Bias, einer unzulässigen Ausrichtung, aufgrund der historischen Reihe, die das Modell zuvor erzeugt hat. Oder schließlich an einem Bias, der auf der Art und Weise beruht, wie das Modell sein „Wissen“ in seinen Parametern enkodiert.
Das deckt aber noch nicht Fälle ab, in denen beispielsweise ChatGPT einen ganzen Artikel der „New York Times“ erfunden und diesen zusammengefasst hat. Auch Jahresbilanzen wurden schon mit erfundenen Zahlen gespickt. Halluzinationen können also sehr weit reichend auftreten. Mit dem Guardrails Toolkit soll damit Schluss sein.
So funktioniert Guardrails
Der Nutzer hat ein beliebiges LLM und eine Anwendung, die das Modell zwecks Konversation usw. nutzt. Damit diese Interaktion sowohl vertrauenswürdig als auch gefahrenfrei, kann der Nutzer mithilfe des quelloffenen Guardrails Tookits und damit verbundener Tools Richtlinien und Regeln in Python programmieren. Hinzukommt die Richtliniensprache Colang von Nvidia, die bereits in NeMo verwendet wird. Zusammen stellen sie zusammensetzbare, lizenzfreie Blaupausen, APIs und Patterns zur Verfügung, die der Nutzer je nach Bedarf in seine Anwendung integriert, etwa als Chatbot. Alle sind von GitHub herunterzuladen.
Das Partner-Tool, das Jonathan Cohen als erstes vorstellte, ist LangChain. Dieses enthält selbst wieder ein LLM und trägt so zu NeMo bei. Ein weiteres Partnerwerkzeug kommt von Zapier. In einem Blogbeitrag erläutern zwei Nvidia-Mitarbeiter die genau Funktionsweise von Guardrails, seiner Programmiersprache Python bzw. Colang und seinen Komponenten wie etwa dem Dialogmanager und dem Richtlinien-Editor, damit die Workflows im ChatBot genau den Regeln entsprechen.
Offene Fragen
Auf Nachfrage versicherte Cohen, dass Guardrails auf alle Herausforderungen hin getestet worden sei. Dazu gehörten schädliche Chatbots und LLMs sowie andere Schadsoftware. Da Guardrails sowohl Missbrauch, für den es trainiert worden ist, verhindern als auch Nutzer sperren könne, stellte sich die Frage, wie weit diese Befugnisse reichen und ob sie obligatorisch werden sollten. Dazu wollte sich Cohen nicht äußern, aber er konnte mit Bestimmtheit verneinen, dass es für solche „Leitplanken“ der Chatbot-Nutzung noch keinen Industriestandard gebe.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.