Suchen

Definition Was ist eine Support Vector Machine?

| Autor / Redakteur: Dipl.-Ing. (FH) Stefan Luber / Nico Litzel

Die Support Vector Machine (SVM) ist eine mathematische Methode, die im Umfeld des maschinellen Lernens zum Einsatz kommt. Sie gestattet das Klassifizieren von Objekten und ist vielfältig nutzbar. Unterstützt werden die lineare und die nicht-lineare Objektklassifizierung. Typische Anwendungsbereiche sind die Bild-, Text- oder Handschrifterkennung.

Firmen zum Thema

(Bild: © aga7ta - stock.adobe.com)

Die Abkürzung für Support Vector Machine lautet SVM. Es handelt sich um eine mathematische Methode und einen statistischen Ansatz zur Klassifizierung von Objekten. Sie lässt sich im maschinellen Lernen als Algorithmus einsetzen, um Daten zu analysieren und die Objekte bestimmten Klassen zuzuordnen.

Die von der Support Vector Machine ermittelten Klassengrenzen sind sogenannte Large Margin Classifier und lassen um die Klassengrenzen herum einen möglichst breiten Bereich frei von Objekten. Die SVM unterstützt sowohl die lineare als auch die nicht-lineare Klassifizierung. Für die nicht-lineare Klassifizierung kommt der sogenannte Kernel-Trick zum Einsatz, der den Objektbereich zur Abbildung nicht-linearer Trennflächen um zusätzliche Dimensionen (Hyperebenen) erweitert.

Die Anwendungsbereiche der Support Vector Machine sind sehr vielfältig. Typische Anwendung ist die Mustererkennung in maschinellen Lernvorgängen von Computerprogrammen. Die mathematische Methode lässt sich beispielsweise in der Bild-, Text- oder Handschrifterkennung verwenden. Eine Stärke der SVM ist ihre große Generalisierungsfähigkeit zur Lösung realer Probleme.

Erste Überlegungen zur Support Vector Machine und zur Klassifizierung durch die Trennung mithilfe von Hyperebenen stammen bereits aus den 1930er-Jahren. Die eigentliche Idee der Support Vector Machine entwickelten Wladimir Wapnik und Alexei Jakowlewitsch Tscherwonenkis viele Jahre später. Der Durchbruch gelang den Support Vector Machines in den 1990er-Jahren mit dem vermehrten Einsatz des maschinellen Lernens. Mittlerweile existieren zahlreiche Anpassungen und Weiterentwicklungen der SVMs.

Funktionsweise einer Support Vector Machine

Eine der zentralen Aufgaben des maschinellen Lernens ist die Klassifizierung von Daten. Ziel der Klassifizierung ist es, anhand vorhandener Daten und Datenzuordnungen zu entscheiden, welcher Klasse ein neues Datenobjekt zugeordnet werden kann. Zunächst wird eine Datenbasis mit Trainingsobjekten benötigt, deren Klassenzuordnung bekannt ist. Auf Basis dieser Daten versuchen die verschiedenen Algorithmen des maschinellen Lernens Trennlinien oder Trennflächen zu finden, mit denen sich neue Objekt den richtigen Klassen zuordnen lassen. Eine Support Vector Machine kann die Objektklassen mithilfe von Trennungsebenen einteilen. Diese Ebenen werden so gewählt, dass zwischen verschiedenen Klassen ein möglichst großer Bereich frei von Objekten bleibt. Die Trennungsfläche mit dem größten Objekt-freien Bereich gilt als optimale Lösung.

Eine SVM unterstützt sowohl die lineare als auch die nicht-lineare Trennbarkeit von Objekten. In realen Problemstellungen sind die Datenobjekte in den meisten Fällen nicht durch rein lineare Grenzen zu klassifizieren. Für nicht-lineare Klassengrenzen verwendet die Support Vector Machine den Kernel-Trick. Hierbei werden die Trennungsvektoren in eine zusätzliche Dimension (Hyperebene) überführt. Je höher die Anzahl der Dimensionen ist, desto komplexere Trennungsflächen lassen sich mit den Trennungsvektoren mehrerer Hyperebenen realisieren. Die Umwandlung der linearen Trennungsflächen der verschiedenen Hyperebenen in nicht-lineare Trennungsflächen findet bei der Rücktransformation der Dimensionen statt. Es können sogar nicht zusammenhängende Trennungsflächen entstehen.

Damit die Hoch- und Rücktransformation der verschiedenen Dimensionen rechnerisch nicht zu aufwendig wird, verwendet die SVM sogenannte Kernelfunktionen zur Beschreibung der Trennflächen. Der Begriff Kernel-Trick leitet sich aus der Verwendung dieser Kernelfunktionen ab.

Typische Anwendungen der Support Vector Machines

Für die mathematische Methode der Support Vector Machine ergeben sich zahlreiche Anwendungsfälle zur Lösung realer Problemstellungen mithilfe des maschinellen Lernens. Häufiger Anwendungsbereich ist die Handschrifterkennung. Anhand von Trainingsdaten kann eine SVM passende Trennungsflächen ermitteln, mit denen sich handschriftlich erstellte Zeichen anschließend zuverlässig den passenden Buchstaben oder Zahlen zuordnen lassen. Ein weiterer Anwendungsbereich ist die Texterkennung (Optical Character Recognition – OCR). Ebenfalls gute Ergebnisse sind mit den Support Vector Machines in der Bilderkennung erzielbar.

Die Stärken der Support Vector Machines

Die Support Vector Machine entwickelt als mathematische Methode im maschinellen Lernen zahlreiche Stärken. Typische Vorteile der Methode sind beispielsweise:

  • Sehr effiziente Methode zur Klassifizierung von Objekten,
  • Unterstützung der linearen und nicht-linearen Klassifizierung,
  • durch die Nutzung von zusätzlichen Dimensionen und Hyperebenen sehr komplexe nicht-lineare Trennungsflächen abbildbar,
  • geringer Rechenaufwand beim Hoch- und Rücktransformieren der Dimensionen durch die Verwendung des Kernel-Tricks,
  • relativ geringer Aufwand zur Implementierung einer Support Vector Machine,
  • geometrisch sehr anschauliche Arbeitsweise des Algorithmus,
  • große Generalisierungsfähigkeit zur Lösung realer Probleme und
  • auch für große Merkmalsräume mit vielen Trainingsdaten und Trainingsmustern anwendbar.

(ID:46219057)

Über den Autor