Anbieter zum Thema

0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist LAMBADA (LAnguage-Model-BAsed Data Augmentation)?

LAMBADA (LAnguage-Model-BAsed Data Augmentation) ist eine Methode, mit der sich auf Basis vorhandener Trainingsdaten weitere Trainingsdaten synthetisch erstellen lassen. Die Trainingsdaten werden mithilfe eines bereits trainierten und speziell feinabgestimmten Sprachmodells automatisch erzeugt. Typischer Einsatzzweck der generierten Daten ist das Training von Modellen zur Textklassifizierung im NLP-Bereich. Ein Training mit den synthetisch vermehrten Daten verbessert die Textklassifizierungsleistung der Modelle in vielen Fällen signifikant.

Weiterlesen

Bildergalerien

Der Autor: Dr. Theo Steininger ist CEO von Erium (Bild: Nadine Rupp)
Kommentar von Dr. Theo Steininger, Erium

So löst die Astrophysik Big-Data-Probleme

Unstrukturierte Rohdaten zu analysieren und so aufzubereiten, dass sie eine wertvolle und verlässliche Basis für wichtige Unternehmensentscheidungen liefern, bedarf einer großen Vorleistung: Sind die Daten fehlerhaft, weisen Lücken auf oder sind in ihrem Umfang sehr eingeschränkt, kommen auch Datenwissenschaftler schnell an ihre Grenzen. Hinzu kommt, dass Unternehmen für einzelne Anwendungsfälle noch nicht genug Daten zur Verfügung haben. Dennoch können Unternehmen von zuverlässigen Prognosen profitieren. Inspiration hierzu liefert die Astrophysik mit Methoden zur Erforschung des Kosmos.

Weiterlesen

Downloads