Definition

Was ist eine Support Vector Machine?

| Autor / Redakteur: Stefan Luber / Nico Litzel

(Bild: © aga7ta - stock.adobe.com)

Die Support Vector Machine (SVM) ist eine mathematische Methode, die im Umfeld des maschinellen Lernens zum Einsatz kommt. Sie gestattet das Klassifizieren von Objekten und ist vielfältig nutzbar. Unterstützt werden die lineare und die nicht-lineare Objektklassifizierung. Typische Anwendungsbereiche sind die Bild-, Text- oder Handschrifterkennung.

Die Abkürzung für Support Vector Machine lautet SVM. Es handelt sich um eine mathematische Methode und einen statistischen Ansatz zur Klassifizierung von Objekten. Sie lässt sich im maschinellen Lernen als Algorithmus einsetzen, um Daten zu analysieren und die Objekte bestimmten Klassen zuzuordnen.

Die von der Support Vector Machine ermittelten Klassengrenzen sind sogenannte Large Margin Classifier und lassen um die Klassengrenzen herum einen möglichst breiten Bereich frei von Objekten. Die SVM unterstützt sowohl die lineare als auch die nicht-lineare Klassifizierung. Für die nicht-lineare Klassifizierung kommt der sogenannte Kernel-Trick zum Einsatz, der den Objektbereich zur Abbildung nicht-linearer Trennflächen um zusätzliche Dimensionen (Hyperebenen) erweitert.

Die Anwendungsbereiche der Support Vector Machine sind sehr vielfältig. Typische Anwendung ist die Mustererkennung in maschinellen Lernvorgängen von Computerprogrammen. Die mathematische Methode lässt sich beispielsweise in der Bild-, Text- oder Handschrifterkennung verwenden. Eine Stärke der SVM ist ihre große Generalisierungsfähigkeit zur Lösung realer Probleme.

Erste Überlegungen zur Support Vector Machine und zur Klassifizierung durch die Trennung mithilfe von Hyperebenen stammen bereits aus den 1930er-Jahren. Die eigentliche Idee der Support Vector Machine entwickelten Wladimir Wapnik und Alexei Jakowlewitsch Tscherwonenkis viele Jahre später. Der Durchbruch gelang den Support Vector Machines in den 1990er-Jahren mit dem vermehrten Einsatz des maschinellen Lernens. Mittlerweile existieren zahlreiche Anpassungen und Weiterentwicklungen der SVMs.

Funktionsweise einer Support Vector Machine

Eine der zentralen Aufgaben des maschinellen Lernens ist die Klassifizierung von Daten. Ziel der Klassifizierung ist es, anhand vorhandener Daten und Datenzuordnungen zu entscheiden, welcher Klasse ein neues Datenobjekt zugeordnet werden kann. Zunächst wird eine Datenbasis mit Trainingsobjekten benötigt, deren Klassenzuordnung bekannt ist. Auf Basis dieser Daten versuchen die verschiedenen Algorithmen des maschinellen Lernens Trennlinien oder Trennflächen zu finden, mit denen sich neue Objekt den richtigen Klassen zuordnen lassen. Eine Support Vector Machine kann die Objektklassen mithilfe von Trennungsebenen einteilen. Diese Ebenen werden so gewählt, dass zwischen verschiedenen Klassen ein möglichst großer Bereich frei von Objekten bleibt. Die Trennungsfläche mit dem größten Objekt-freien Bereich gilt als optimale Lösung.

Eine SVM unterstützt sowohl die lineare als auch die nicht-lineare Trennbarkeit von Objekten. In realen Problemstellungen sind die Datenobjekte in den meisten Fällen nicht durch rein lineare Grenzen zu klassifizieren. Für nicht-lineare Klassengrenzen verwendet die Support Vector Machine den Kernel-Trick. Hierbei werden die Trennungsvektoren in eine zusätzliche Dimension (Hyperebene) überführt. Je höher die Anzahl der Dimensionen ist, desto komplexere Trennungsflächen lassen sich mit den Trennungsvektoren mehrerer Hyperebenen realisieren. Die Umwandlung der linearen Trennungsflächen der verschiedenen Hyperebenen in nicht-lineare Trennungsflächen findet bei der Rücktransformation der Dimensionen statt. Es können sogar nicht zusammenhängende Trennungsflächen entstehen.

Damit die Hoch- und Rücktransformation der verschiedenen Dimensionen rechnerisch nicht zu aufwendig wird, verwendet die SVM sogenannte Kernelfunktionen zur Beschreibung der Trennflächen. Der Begriff Kernel-Trick leitet sich aus der Verwendung dieser Kernelfunktionen ab.

Typische Anwendungen der Support Vector Machines

Für die mathematische Methode der Support Vector Machine ergeben sich zahlreiche Anwendungsfälle zur Lösung realer Problemstellungen mithilfe des maschinellen Lernens. Häufiger Anwendungsbereich ist die Handschrifterkennung. Anhand von Trainingsdaten kann eine SVM passende Trennungsflächen ermitteln, mit denen sich handschriftlich erstellte Zeichen anschließend zuverlässig den passenden Buchstaben oder Zahlen zuordnen lassen. Ein weiterer Anwendungsbereich ist die Texterkennung (Optical Character Recognition – OCR). Ebenfalls gute Ergebnisse sind mit den Support Vector Machines in der Bilderkennung erzielbar.

Die Stärken der Support Vector Machines

Die Support Vector Machine entwickelt als mathematische Methode im maschinellen Lernen zahlreiche Stärken. Typische Vorteile der Methode sind beispielsweise:

  • Sehr effiziente Methode zur Klassifizierung von Objekten,
  • Unterstützung der linearen und nicht-linearen Klassifizierung,
  • durch die Nutzung von zusätzlichen Dimensionen und Hyperebenen sehr komplexe nicht-lineare Trennungsflächen abbildbar,
  • geringer Rechenaufwand beim Hoch- und Rücktransformieren der Dimensionen durch die Verwendung des Kernel-Tricks,
  • relativ geringer Aufwand zur Implementierung einer Support Vector Machine,
  • geometrisch sehr anschauliche Arbeitsweise des Algorithmus,
  • große Generalisierungsfähigkeit zur Lösung realer Probleme und
  • auch für große Merkmalsräume mit vielen Trainingsdaten und Trainingsmustern anwendbar.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Aktuelle Beiträge zu diesem Thema

So bereitet Machine Learning Big Data auf

Machine Learning

So bereitet Machine Learning Big Data auf

Seit 2014 haben Anbieter wie Microsoft, IBM, Amazon und die Apache Software Foundation das maschinelle Lernen (Machine Learning, ML) gefördert und in der Cloud zur Verfügung gestellt. Erzwungen durch den Mangel an Data Scientists, bieten ML-Algorithmen einen leicht erlernbaren Weg, um Prognosen zu erstellen. lesen

Predictive Analytics mit R

Statistikmodelle ohne Programmierkenntnisse erstellen

Predictive Analytics mit R

Die Voraussage von Ereignissen hängt von der Erkennung von Zusammenhängen, Mustern und Korrelationen in Daten ab. Dabei werden vor allem statistisch-mathematische Methoden angewendet. Die Statistik-Sprache R findet dabei zunehmend Verbreitung, nicht mehr nur an Hochschulen, sondern zunehmend auch in der Wirtschaft. lesen

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de/ (ID: 46219057 / Definitionen)