Cloudera beschleunigt die Entwicklung und den Einsatz von generativer KI

Cloudera AI Inference mit Nvidia NIM Microservices Cloudera beschleunigt die Entwicklung und den Einsatz von generativer KI

28.11.2024 Von Bernhard Lück 3 min Lesedauer

Anbieter zum Thema

Cloudera

NVIDIA GmbH

Disy Informationssysteme GmbH

INFOMOTION GmbH

QUNIS GmbH

Cloudera hat einen neuen KI-Inferenzdienst vorgestellt: Cloudera AI Inference könne als einer der branchenweit ersten KI-Inferenzdienste mit eingebetteter Nvidia-NIM-Microservice-Fähigkeit die Bereitstellung und Verwaltung umfangreicher KI-Modelle rationalisieren.

Unternehmen müssen heute generative KI nahtlos in ihre bestehende Dateninfrastruktur integrieren, um Geschäftsergebnisse zu erzielen.(Bild: © Krot_Studio – stock.adobe.com) — Unternehmen müssen heute generative KI nahtlos in ihre bestehende Dateninfrastruktur integrieren, um Geschäftsergebnisse zu erzielen.
(Bild: © Krot_Studio – stock.adobe.com)

Der neue KI-Inferenzdienst sei eine Kombination der Kernkompetenzen von Cloudera und Nvidia: Cloudera liefere vertrauenswürdige Daten als Grundlage für zuverlässige KI, Nvidia Accelerated Computing und die Software-Plattform Nvidia AI Enterprise seien verantwortlich für die Bereitstellung sicherer und performanter KI-Anwendungen. Mithilfe von Cloudera AI Inference könnten Unternehmen das wahre Potenzial ihrer Daten nutzen, um GenAI von der Pilotphase bis zur vollständigen Umsetzung voranzutreiben.

Die größten Hindernisse für die Einführung von GenAI seien Risiken und Bedenken in den Bereichen Compliance und Governance – Cloudera beruft sich hier auf die Ergebnisse einer Studie von Deloitte. Um diese Zweifel zu entkräften, müssten Unternehmen dazu übergehen, KI-Modelle und -Anwendungen privat zu betreiben – entweder on-premises oder in öffentlichen Clouds. Diese Umstellung erfordere sichere und skalierbare Lösungen, die komplexe Do-it-yourself-Ansätze vermeiden.

Cloudera AI Inference könne sensible Daten vor dem Abfluss zu nicht privaten, von Anbietern gehosteten KI-Modelldiensten schützen – durch eine sichere Entwicklung und Bereitstellung innerhalb der eigenen Kontrolle der Unternehmen. Der auf Nvidia-Technologie basierende Service helfe bei der Erzeugung vertrauenswürdiger Daten für eine zuverlässige KI mit hoher Geschwindigkeit für eine effiziente Entwicklung KI-gesteuerter Chatbots, virtueller Assistenten und agentenbasierter Anwendungen.

Entwickler könnten LLMs in Unternehmensqualität mit bis zu 36-facher Leistung mit Nvidia Tensor Core GPUs und fast vierfachem Durchsatz im Vergleich zu herkömmlichen CPUs (Central Processing Units) erstellen, anpassen und bereitstellen. Die nahtlose Benutzererfahrung integriere die Bedienoberfläche (UI) und Programmierschnittstellen (APIs) direkt in Nvidia-NIM-Microservice-Container, wodurch Befehlszeilenschnittstellen (CLI) und separate Überwachungssysteme überflüssig würden. Die Service-Integration mit der AI Model Registry von Cloudera würde zudem die Sicherheit und Governance verbessern – durch die Verwaltung von Zugriffskontrollen sowohl für Modell-Endpunkte als auch für den Betrieb. Anwender könnten von einer einheitlichen Plattform profitieren, auf der alle Modelle – ob LLM-Implementierungen oder herkömmliche Modelle – nahtlos über einen einzigen Service verwaltet werden.

Wichtige Funktionen von Cloudera AI Inference:

Erweiterte KI-Fähigkeiten: Nutzung von Nvidia-NIM-Microservices zur Optimierung von Open-Source-LLMs, einschließlich LLama und Mistral, für Fortschritte bei der Verarbeitung natürlicher Sprache (NLP), Computer Vision und anderen KI-Bereichen.

Hybride Cloud und Datenschutz: Ausführung von Workloads vor Ort oder in der Cloud, mit Bereitstellung in der Virtual Private Cloud (VPC) für verbesserte Sicherheit und Einhaltung von Vorschriften.

Skalierbarkeit und Überwachung: automatische Skalierung, Hochverfügbarkeit (HA) und Leistungsverfolgung in Echtzeit, um Probleme zu erkennen und zu beheben und eine effiziente Ressourcenverwaltung zu gewährleisten.

Offene APIs und CI/CD-Integration: standardkonforme APIs für die Modellbereitstellung, -verwaltung und -überwachung, um eine nahtlose Integration mit CI/CD-Pipelines und MLOps-Workflows (Machine Learning Operations) zu ermöglichen.

Unternehmenssicherheit: Durchsetzung des Modellzugriffs mit Funktionen für Servicekonten, Zugriffskontrolle, Datenherkunft und Auditing.

Risikogesteuerte Bereitstellung: Durchführung von A/B-Tests und Canary-Rollouts für kontrollierte Modell-Updates.

„Unternehmen sind bereit, in GenAI zu investieren. Dafür benötigen sie skalierbare sowie sichere, konforme und gut verwaltete Daten“, sagt Branchenanalyst Sanjeev Mohan. „Die Einführung von KI in großem Umfang in der privaten Cloud führt zu einer Komplexität, die mit DIY-Ansätzen nur schwer zu bewältigen ist. Cloudera AI Inference überbrückt diese Lücke, indem es fortschrittliches Datenmanagement mit der KI-Expertise von Nvidia verbindet und so das volle Potenzial der Daten freisetzt und sie gleichzeitig schützt. Mit unternehmensgerechten Sicherheitsfunktionen wie Service-Accounts, Zugriffskontrolle und Audits können Unternehmen ihre Daten zuverlässig schützen und Workloads vor Ort oder in der Cloud ausführen, um KI-Modelle mit der nötigen Flexibilität und Governance effizient einzusetzen.“

(ID:50235203)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Geschäftliche E-Mail

Bitte geben Sie eine gültige E-Mailadresse ein.

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Stand: 08.12.2025

Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.

Einwilligung in die Verwendung von Daten zu Werbezwecken

Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.

Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.

Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.

Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.

Recht auf Widerruf

Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.