Induktive Programmierung

Maschinelles Lernen ohne großen Datensatz ermöglichen

| Autor / Redakteur: Katharina Juschkat / Nico Litzel

Maschinelles Lernen benötigt eigentlich einen großen Datensatz. Die Informatik-Professorin Ute Schmid entwickelt einen alternativen Ansatz.
Maschinelles Lernen benötigt eigentlich einen großen Datensatz. Die Informatik-Professorin Ute Schmid entwickelt einen alternativen Ansatz. (Bild: gemeinfrei / Pixabay)

Die Informatikerin Ute Schmid forscht an der Methode der induktiven Programmierung – einem Ansatz, der es ermöglicht, ein System des maschinellen Lernens ohne großen Datensatz aufzubauen. Vor allem in der Medizin und der Industrie soll die Methode nützlich sein.

Um maschinelles Lernen erfolgreich umzusetzen, braucht es vor allem massenweise Daten. Denn nur mit genügend Trainingsmaterial erkennt ein Algorithmus Gesetzmäßigkeiten und kann Regeln ableiten. Was aber, wenn es zu wenige Daten gibt?

Maschinelles Lernen mit wenigen Daten

Die Informatik-Professorin Ute Schmid lehrt Angewandte Informatik an der Universität Bamberg und ist auch diplomierte Psychologin. Sie forscht im Bereich Künstliche Intelligenz.
Die Informatik-Professorin Ute Schmid lehrt Angewandte Informatik an der Universität Bamberg und ist auch diplomierte Psychologin. Sie forscht im Bereich Künstliche Intelligenz. (Bild: Fortiss)

Die Informatik-Professorin Ute Schmid entwickelt genau für diese Fall eine neue Methode. Induktive Programmierung heißt die Methode, mit der sich die Leiterin der Forschungsgruppe Kognitive Systeme der Universität Bamberg beschäftigt. Sie erforscht, wie Programme aus Ein-/Ausgabe-Beispielen oder beobachteten Eingabefolgen in einem System lernen. Die Methode ergänzt aktuelle Blackbox-Ansätze des „Deep Learning“, einem Teilgebiet des Maschinellen Lernens, das künstliche neuronale Netze einsetzt und viele Trainingsdaten benötigt. Außerdem ermöglicht sie, Hintergrund- und Expertenwissen zu berücksichtigen.

Mögliche Anwendungsfelder der induktiven Programmierung

Anwendungsfelder solcher Verfahren sind etwa die medizinische Diagnose oder die industrielle Produktion, weil es dort oft nur wenige Daten gibt, um ein Modell zu trainieren.

Ein weiterer Anwendungsbereich wäre das sogenannte „Data Wrangling“. Das Data Wrangling, oder die Datenaufbereitung, beschreibt den Vorgang, Rohdaten zu strukturieren, bereinigen und zu validieren, um sie für den Einsatz in Systemen des maschinellen Lernens vorzubereiten.

Rohdaten nur mit Interaktion von Experten interpretierbar

In manchen Anwendungsbereichen, etwa der medizinischen Diagnose, gibt es oft gar keine sogenannte „ground truth“ – also keine große Datenbasis. Das heißt, auch ein Experte kann nur nach bestem Wissen einschätzen, welche Diagnose korrekt wäre. „Es geht um die Kombination von induktiver Programmierung mit End-to-end-Ansätzen – also Deep-Learning-Ansätzen, bei denen direkt aus den Rohdaten, etwa aus Bildern, gelernt wird“, erläutert Prof. Ute Schmid. Dies setze voraus, dass semantisch interpretierbare Informationen aus den neuronalen Netzen extrahiert werden, was teilweise nur in Interaktion mit menschlichen Experten möglich ist. „Ich gehe davon aus, dass es für viele praktische Anwendungen ohnehin notwendig wird, interaktive Ansätze des maschinellen Lernens zu nutzen oder zu entwickeln, da es gar nicht möglich oder sehr teuer ist, Trainingsdaten ohne menschliche Hilfe korrekt zu kennzeichnen.“

Methoden der induktiven Programmierung ermöglichen es, Hintergrund- und Expertenwissen beim Lernen zu berücksichtigen, was ein Lernen mit wenigen Daten ermöglichen soll.

Prof. Schmid forscht an der induktiven Programmierung im Rahmen des Leitprojektes „Robuste KI“ am Forschungsinstitut Fortiss.

Dieser Artikel stammt von unserem Partnerportal weAutomate.de.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de/ (ID: 46308195 / Künstliche Intelligenz)