Was ist LAMBADA (LAnguage-Model-BAsed Data Augmentation)?



  • LAMBADA (LAnguage-Model-BAsed Data Augmentation) ist eine Methode, mit der sich auf Basis vorhandener Trainingsdaten weitere Trainingsdaten synthetisch erstellen lassen. Die Trainingsdaten werden mithilfe eines bereits trainierten und speziell feinabgestimmten Sprachmodells automatisch erzeugt. Typischer Einsatzzweck der generierten Daten ist das Training von Modellen zur Textklassifizierung im NLP-Bereich. Ein Training mit den synthetisch vermehrten Daten verbessert die Textklassifizierungsleistung der Modelle in vielen Fällen signifikant.

    Klicken sie hier um den Artikel zu lesen


Log in to reply