Suchen

Definition Was ist ein Deepfake?

| Autor / Redakteur: Dipl.-Ing. (FH) Stefan Luber / Nico Litzel

Der Begriff Deepfake steht für das Fälschen oder Ändern von Video- oder Audioinhalten mithilfe Künstlicher Intelligenz (KI). Es kommen künstliche neuronale Netzwerke und Verfahren des maschinellen Lernens zum Einsatz, um beispielsweise Gesichter in Videosequenzen durch Gesichter anderer Personen zu ersetzen. Einige Deepfake-Methoden funktionieren in Echtzeit.

Firma zum Thema

(Bild: © aga7ta - stock.adobe.com)

Das Wort Deepfake setzt sich aus den beiden englischen Begriffen „Deep Learning“ und „Fake“ zusammen. Deepfake bezeichnet das Fälschen oder Ändern von Videos oder Audioinhalten mithilfe Künstlicher Intelligenz. Für Deepfakes kommen künstliche neuronale Netze und Methoden des maschinellen Lernens (Deep Learning) zum Einsatz. Eine Software tauscht beispielsweise Gesichter von Personen in bestehenden Videosequenzen aus, lässt Personen fremde Texte sprechen oder verändert Bewegungen von Personen. Die erstellten Inhalte wirken authentisch und echt. Sie sind oft nur schwer als Fälschungen zu erkennen.

Durch die steigende Rechenleistung und immer leistungsfähigere Künstliche Intelligenz verbessert sich die Qualität der Deepfakes kontinuierlich. Mittlerweile existieren Programme und Apps, mit denen selbst Laien ohne spezifische Kenntnisse in der Videobearbeitung Deepfakes in hoher Qualität erstellen können. Die Programme erzeugen die Deepfakes nahezu autonom, ohne manuellen Eingriff des Anwenders. Es ist vom Nutzer lediglich das Video- oder Audiomaterial bereitzustellen.

Deepfakes sind zu verschiedenen Zwecken einsetzbar. Die Anwendungsmöglichkeiten reichen von Satire und Unterhaltung, über bewusste Desinformation und Propaganda bis zur gezielten Diskreditierung einzelner Personen. Deepfakes verletzen, juristisch gesehen, ohne entsprechende Berechtigung durch die betroffenen Personen die Persönlichkeitsrechte oder stellen Beleidigungen dar. Mittlerweile existieren Programme, die ebenfalls auf Basis Künstlicher Intelligenz die Echtheit von Videos und Audioinhalten prüfen und Fälschungen identifizieren.

Mögliche Arten von Deepfakes

Der Begriff Deepfake umfasst das Fälschen und Manipulieren von Video-, Bild- und Audioinhalten. Im Bereich der Manipulation von Videos und Bildern ist das sogenannte Face Swapping sehr verbreitet. Beim Face Swapping werden Gesichter auf Bildern oder Videos durch Gesichter anderer Personen ersetzt. Dadurch lassen sich Personen in einem völlig anderen Kontext darstellen. Analog zum Face Swapping existiert im Audiobereich das Voice Swapping. Per Voice Swapping lassen sich Audioinhalte so verändern, dass Texte von fremden Personen (Stimmen) gesprochen werden.

Eine weitere Art der Deepfakes im Videoumfeld ist Body Puppetry. Diese Art von Deepfake überträgt einzelne Bewegungen oder komplette Bewegungsabläufe auf andere Personen. Während einige Deepfakes relativ lange Zeit beanspruchen, da die Systeme zunächst mit dem Ausgangsmaterial trainiert werden müssen und erst anschließend Inhalte verändern, funktionieren einige Deepfake-Methoden in Echtzeit. So ist es beispielsweise möglich, Mimik und Lippenbewegungen einer Person zu erfassen und diese in Echtzeit auf das Videobild einer anderen Person zu übertragen.

Technische Basis und Funktionsweise der Erstellung von Deepfakes

Die technische Basis für Deepfakes stellt die Künstliche Intelligenz bereit. Künstliche neuronale Netze und Algorithmen des maschinellen Lernens analysieren das bereitgestellte Video- und Audiomaterial und erstellen neue Inhalte. Komplette Forschungs- und Entwicklungsbereiche beschäftigen sich mit den KI-Methoden für Deepfakes. Zunächst werden die Algorithmen und neuronalen Netze mit dem Bild- und Audiomaterial gefüttert. Es werden Video- oder Audioinhalte des Ausgangsmaterials und der Personen benötigt, die man fälschen möchte. Je mehr Material zur Verfügung steht, desto besser können die neuronalen Netze trainiert werden.

Vorteilhaft für das Face Swapping sind beispielsweise Aufnahmen der Personen aus verschiedenen Perspektiven und mit unterschiedlicher Mimik. Während des Trainings lernen die Algorithmen die wesentlichen Eigenschaften der Personen in den verschiedenen Bildinhalten kennen. Nach dem Training ist die KI in der Lage, diese Eigenschaften in anderes Material zu übertragen, ohne das Umfeld zu verändern. Mehr und mehr gelingt es, die Menge des benötigten Bildmaterials für authentische Fälschungen zu reduzieren. Mittlerweile ist es Forschern gelungen, mit nur einem einzigen Bild einer Person komplette Videos zu fälschen.

Um Deepfakes ohne tiefere Kenntnisse der Künstlichen Intelligenz oder der Videobearbeitung zu erzeugen, existieren Programme und Apps. Mit diesen sind Laien in der Lage, Deepfakes in erstaunlich hoher Qualität zu generieren. Eine dieser Apps ist beispielsweise FakeApp. Sie ermöglicht das Face Swapping in Videosequenzen und benötigt lediglich das zu fälschende Ausgangsmaterial und Bildmaterial der einzusetzenden Person. Mithilfe eines Deep-Learning-Algorithmus, der auf dem KI-Framework TensorFlow basiert, und entsprechender Rechenleistung einer Grafikkarte sowie Speicher erzeugt FakeApp selbstständig die Deepfakes. Gesichter werden nach einer längeren Rechenzeit quasi auf Knopfdruck ausgetauscht.

Typische Anwendungen für Deepfakes

Deepfakes werden für zahlreiche legale oder illegale Anwendungen genutzt. Typische Anwendungsbereiche sind:

  • Kunst- und Filmbranche
  • Propaganda
  • gezielte Desinformation
  • Diskreditierung von Einzelpersonen
  • Erstellung pornografischer Inhalte

(ID:46417158)

Über den Autor