Definition

Was ist ein Convolutional Neural Network?

| Autor / Redakteur: Stefan Luber / Nico Litzel

(Bild: © aga7ta - stock.adobe.com)

Das Convolutional Neural Network ist eine besondere Form des künstlichen neuronalen Netzwerks. Es besitzt mehrere Faltungsschichten und ist für maschinelles Lernen und Anwendungen mit Künstlicher Intelligenz (KI) im Bereich Bild- und Spracherkennung sehr gut geeignet.

Convolutional Neural Network bedeutet im Deutschen „Gefaltetes Neuronales Netzwerk“. Die Abkürzung lautet CNN. Es handelt sich um eine Sonderform eines künstlichen neuronalen Netzes, das speziell für maschinelles Lernen und die Verarbeitung von Bild- oder Audiodaten vorgesehen ist.

Die Funktionsweise ist zu einem gewissen Teil biologischen Vorgängen nachempfunden. Der Aufbau ist ähnlich der Sehrinde des Gehirns. Das Convolutional Neural Network besteht aus mehreren Schichten. Diese Schichten sind Faltungsschichten, Subsampling-Schichten und vollvermaschte Schichten. Das Training eines Convolutional Neural Networks findet gewöhnlich überwacht statt. Einer der Begründer des Convolutional Neural Networks ist Yann LeCun.

Aufbau eines Convolutional Neural Networks

Herkömmliche neuronale Netze bestehen aus voll- oder teilvermaschten Neuronen in mehreren Ebenen. Diese Strukturen stoßen bei der Verarbeitung von Bildern an ihre Grenzen, da eine der Pixelanzahl entsprechende Zahl an Eingängen vorhanden sein müsste. Die Zahl der Layer und der Verbindungen untereinander wäre riesig und nur von Rechnern mit sehr großer Leistung zu bewältigen. Das Convolutional Neural Network setzt sich aus verschiedenen Schichten zusammen und ist vom Grundprinzip ein zum Teil lokal vermaschtes neuronales Feedforward-Netz. Die einzelnen Schichten des CNN sind:

  • Die Convolutional-Schicht,
  • die Pooling-Schicht und
  • die vollständig vermaschte Schicht.

Die Pooling-Schicht folgt der Convolutional-Schicht und kann in dieser Kombination mehrfach hintereinander vorhanden sein. Da die Pooling-Schicht und die Convolutional-Schicht lokal vermaschte Teilnetze sind, bleibt die Anzahl an Verbindungen in diesen Schichten selbst bei großen Eingabemengen begrenzt und in einem beherrschbaren Rahmen. Den Abschluss bildet eine vollständig vermaschte Schicht.

Die Aufgaben der einzelnen Schichten

Die Convolutional-Schicht ist die eigentliche Faltungsebene. Sie ist in der Lage, in den Eingabedaten einzelne Merkmale zu erkennen und zu extrahieren. Bei der Bildverarbeitung können dies Merkmale wie Linien, Kanten oder bestimmte Formen sein. Die Verarbeitung der Eingabedaten erfolgt in Form einer Matrix. Es kommen Matrizen definierter Größe (Breite x Höhe x Kanäle) zum Einsatz.

Die Pooling-Schicht, auch Subsampling-Schicht genannt, verdichtet und reduziert die Auflösung der erkannten Merkmale. Hierfür verwendet die Schicht Methoden wie das Maximal-Pooling oder Mittelwert-Pooling. Das Pooling verwirft überflüssige Informationen und reduziert die Datenmenge. Die Leistungsfähigkeit beim maschinellen Lernen wird dadurch nicht verringert. Durch das reduzierte Datenaufkommen erhöht sich die Berechnungsgeschwindigkeit.

Den Abschluss des Convolutional Neural Networks bildet die vollständig verknüpfte Schicht. Sie schließt sich den sich wiederholenden Abfolgen der Convolutional- und Pooling-Schichten an. Alle Merkmale und Elemente der vorgelagerten Schichten sind mit jedem Ausgabemerkmal verknüpft. Die vollständig verbundenen Neuronen können in mehreren Ebenen angeordnet sein. Die Anzahl der Neuronen ist abhängig von den Klassen oder Objekten, die das neuronale Netz unterscheiden soll.

Vorteile eines Convolutional Neural Networks im Bereich Bilderkennung

Gegenüber herkömmlichen nicht gefalteten neuronalen Netzen bietet das Convolutional Neural Network zahlreiche Vorteile. Es eignet sich für maschinelles Lernen und Anwendungen der Künstlichen Intelligenz mit großen Mengen an Eingabedaten wie in der Bilderkennung. Das Netzwerk arbeitet robust und ist gegenüber Verzerrungen oder anderen optischen Veränderungen unempfindlich. Das CNN kann unter verschiedenen Lichtverhältnissen und in unterschiedlichen Perspektiven aufgenommene Bilder verarbeiten. Es erkennt dennoch die typischen Merkmale eines Bildes.

Da das CNN in mehrere lokale, teilvermaschte Schichten aufgeteilt ist, hat es einen wesentlich geringeren Speicherplatzbedarf als vollvermaschte neuronale Netze. Die Faltungsschichten reduzieren die Speicheranforderungen drastisch. Ebenfalls stark verkürzt ist die Trainingszeit des Convolutional Neural Networks. Mit dem Einsatz moderner Grafikprozessoren lassen sich CNNs sehr effizient trainieren. CNNs sind in der Bilderkennung die State-of-the-Art-Methode für maschinelles Lernen und Klassifizierung.

Die Arbeitsweise am Beispiel der Bilderkennung

Das CNN erkennt und extrahiert Merkmale der Eingangsbilder mithilfe von Filtern. Die Erkennung der Strukturen ist innerhalb des Bildes ortsunabhängig. Zunächst erkennt das CNN in den ersten Ebenen einfache Strukturen wie Linien, Farbtupfer oder Kanten. In den weiteren Ebenen lernt das Convolutional Neural Network Kombinationen aus diesen Strukturen wie einfache Formen oder Kurven. Mit jeder Ebene lassen sich komplexere Strukturen identifizieren. Die Daten werden in den Ebenen immer wieder neu abgetastet und gefiltert. Im letzten Schritt werden die Ergebnisse den zu erkennenden Klassen oder Objekten zugeordnet.

Anwendungsbereiche des Convolutional Neural Networks

Der wichtigste Anwendungsbereich für Convolutional Neural Networks ist die Bilderkennung. Zum Einsatz kommen die künstlichen neuronalen Netzwerke zum Beispiel im Bereich der Gesichtserkennung und Objekterkennung. Ein weiteres wichtiges Einsatzgebiet ist die Spracherkennung. Die CNNs erzielen sehr gute Ergebnisse beim semantischen Parsen, bei der Klassifizierung und Modellierung von Sätzen oder beim maschinellen Übersetzen.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Aktuelle Beiträge zu diesem Thema

Was echte KI-Security von Katzenbildern lernen kann

Künstliche Intelligenz im Sicherheitskontext

Was echte KI-Security von Katzenbildern lernen kann

Hacker finden meist schnell einen Weg, neue Technologien zu ihrem Vorteil zu nutzen und KI ist da keine Ausnahme. Um intelligenten Cyberangriffen die Stirn zu bieten, müssen Security-Anbieter schon heute Wege finden, das Potenzial der neuen Technologie tatsächlich auszuschöpfen. Ein möglicher Schlüssel hierzu findet sich an unerwarteter Stelle: in der Bilderkennung. lesen

Künstliche Intelligenz verschlagwortet Produktbilder

Kommentar von Hilmar Buchta, Oraylis

Künstliche Intelligenz verschlagwortet Produktbilder

Als führende Handelskooperation für Bekleidung muss die ANWR Group laufend Produktangaben für die Präsentation in Web-Shops manuell erfassen – ein sehr zeitintensives und aufwendiges Verfahren. Infolgedessen hat das Unternehmen eine Bilderkennung für Schuhe entwickelt, die über die Produktfotos alle relevanten Angaben generiert. Basis bildet ein vortrainiertes Modell, dessen angelerntes Wissen zum Teil auf die neue Aufgabenstellung übertragen werden konnte. lesen

Intel präsentiert KI-Beschleunigung per USB-Stick

Movidius Neural Compute Stick

Intel präsentiert KI-Beschleunigung per USB-Stick

Intel hat erstmals eine dedizierte eigenständige Hardware-Beschlunigung für Künstliche Intelligenz in Form eines USB-Sticks vorgestellt. Der Movidius Neural Compute Stick soll die Entwicklung, Feinabstimmung und Bereitstellung von KI-Systemen erleichtern. lesen

Wie sich das menschliche Gehirn im Computer nachbilden lässt

Künstliche Intelligenz

Wie sich das menschliche Gehirn im Computer nachbilden lässt

Die Herausforderung, die Komplexität des menschlichen Gehirns im Computer nachzubilden, hat eine neue Generation von Wissenschaftlern und Entwicklern von Computeralgorithmen hervorgebracht. lesen

Was das Smart Home über uns verrät

Datenschutz

Was das Smart Home über uns verrät

Im Smart Home sollen die Menschen künftig Energie, Zeit und bares Geld sparen. Doch das intelligente Zuhause mit all seinem Komfort ruft auch Datenschützer und andere Kritiker auf den Plan. Wir haben uns mit der Datensammelwut des smarten Eigenheims auseinandergesetzt. lesen

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 45756863 / Definitionen)