„Instruction-following LLM“ in neuer Version Databricks Dolly 2.0 soll Keimzelle für große Datensätze werden

Von Martin Hensel Lesedauer: 1 min |

Anbieter zum Thema

Mit Dolly 2.0 hat Databricks ein quelloffenes Large Language Model (LLM) vorgestellt. Hierbei handelt es sich um eine Weiterentwicklung des erst kürzlich veröffentlichten Dolly 1.0, das ChatGPT-ähnliche Interaktivität („Instruction-following“) ermöglicht.

Mit Dolly 2.0 hat Databricks sein quelloffenes LLM weiterentwickelt.
Mit Dolly 2.0 hat Databricks sein quelloffenes LLM weiterentwickelt.
(Bild: Databricks)

Dolly 2.0 ist ein 12-Milliarden-Parameter-Sprachmodell auf Basis der EleutherAI-Pythia-Modellfamilie. Es wurde ausschließlich auf einem neuen, qualitativ hochwertigen Anwendungsdatensatz feinabgestimmt. Letzterer stammt von Databricks-Mitarbeitern, wurde per Crowdsourcing erstellt und ist für den Einsatz in der Forschung sowie kommerzielle Nutzung lizenziert.

Quelloffenes Gesamtpaket

Databricks stellt Dolly 2.0 als Open-Source-Komplettpaket zur Verfügung. Dies schließt den Trainingscode, den Anwendungsdatensatz sowie Modellgewichtung mit ein. Alle Bestandteile sind für den kommerziellen Einsatz geeignet. Unternehmen und Organisationen sollen somit selbst LLMs erstellen und anpassen können, ohne dabei für den API-Zugang bezahlen oder Daten mit Dritten teilen zu müssen. Zudem soll Dolly 2.0 Innovationen fördern, indem Unternehmen auf ihren eigenen Datensätzen und dem vorhandenen Know-how aufbauen.

Der bei Dolly 2.0 mitgelieferte Datensatz könnte auch als Keimzelle für die zukünftige Erstellung großer synthetischer Datensätze dienen, die wiederum leistungsfähigere Sprachmodelle nach sich ziehen. Databricks hat sich deshalb im Gegensatz zu anderen Projekten dazu entscheiden, die Nutzung von Dolly 2.0 und dessen Datasets für Forschung und kommerziellen Einsatz nicht zu beschränken.

Verfügbarkeit

Dolly 2.0 steht ab sofort bereit. Ein Blog-Beitrag liefert zudem ausführliche Informationen rund um das neue Databricks-LLM.

(ID:49330175)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung