Kommentar von Markus Feigelbinder, Fineway

Willkommen im Zeitalter der virtuellen Assistenten

| Autor / Redakteur: Markus Feigelbinder / Nico Litzel

Der Autor: Markus Feigelbinder ist Gründer und Chief Operating Officer (COO) des Travel Tech-Start-ups Fineway
Der Autor: Markus Feigelbinder ist Gründer und Chief Operating Officer (COO) des Travel Tech-Start-ups Fineway (Bild: Fineway)

Beim Gedanken an Mensch-Maschine-Interaktionen kommen den meisten Menschen vermutlich nicht Attribute wie „natürlich“, „einfach“ oder „zuverlässig“ in den Sinn. Eine Weile sah es so aus, als würde es Chatbots gelingen, die Interaktion zwischen Menschen und Maschinen zu revolutionieren und zu vereinfachen. Der Trend bei den großen Playern unter den Technologieunternehmen geht jedoch schon in eine neue Richtung, zur Sprachsteuerung.

„The best interface is no interface” proklamiert Golden Krishna, Design Strategist bei Google. Auch wenn im Fachjargon „Voice“ ebenfalls als Interface bezeichnet wird, so ist der Unterschied zwischen dem Conversational Interface (CI) und dem grafischen User Interface doch sehr deutlich. Sprachgesteuerte Assistenten reagieren sofort auf die Stimme des Nutzers und müssen nicht manuell aktiviert und bedient werden. Sie bieten dabei weit mehr Einsatzmöglichkeiten als beispielsweise Chatbots. Neben Anwendungsmöglichkeiten im Marketing und der reinen Suche erleichtern sprachgesteuerte Assistenten die Bedienung von Smart-Home-Produkten oder übernehmen komplexe Aufgaben wie die Buchung ganzer Reisen. Auch deshalb sind intelligente, persönliche Assistenten wie Alexa oder Google Home aktuell so beliebt und ziehen in immer mehr Haushalte ein.

Kommunikation mit Sprachassistenten ist beliebt

Bereits heute nutzen 36 Prozent der Deutschen Sprachassistenten in ihrem Alltag – Tendenz steigend. Dies fand eine Studie des Digital Transformation Institute von Capgemini heraus. Kommuniziert wird dazu am liebsten über das Smartphone (84 Prozent). Das Statistik-Portal Statista prognostiziert, dass bis zum Jahr 2021 etwa 1,8 Milliarden Menschen weltweit digitale Sprachassistenten nutzen werden – ein knappes Viertel der Weltbevölkerung. Aktuell greifen etwa eine Milliarde Menschen auf sie zu. Noch werden größtenteils einfache Informationen über die Sprachsteuerung gesucht, Anrufe ausgeführt oder Navigationsprogramme bedient. Experten gehen jedoch davon aus, dass die Anwendungsmöglichkeiten bald weit komplexer werden.

Komplexer werdende Anwendungsfälle ergeben sich vor allem dadurch, dass die Spracherkennung immer akkurater wird. Geräte, wie beispielsweise der Google Assistant, erkennen Sprache bereits mit 95-prozentiger Genauigkeit. Auch wenn es bis zu 100 Prozent genauer Spracherkennung nicht mehr weit zu sein scheint, wird es noch einige Zeit dauern, bis Assistenten die menschliche Sprache in all ihren Nuancen – vor allem mit ihren vielen Dialekten – komplett verstehen.

Hybrid aus Text und Stimme

Bis es soweit ist, werden Hybridformen aus sprachgesteuerten und grafischen Benutzeroberflächen den goldenen Mittelweg darstellen. Sie werden mittels natürlicher Sprache bedient und ermöglichen dem Nutzer folglich die Eingabe von Text, erlauben es aber auch, mit der Oberfläche zu sprechen. Diese Optionen werden unterstützt durch grafische Elemente, wie Buttons, Ergebnislisten, Bilder oder Videos.

Diese kombinierten Benutzeroberflächen kompensieren bestehende Schwachstellen der eingesetzten Interfaces. So schwächen sie Mängel der Spracherkennung ab, indem sie sie mit grafischen Elementen umgehen. Gleichzeitig schöpfen sie den aktuellen Entwicklungsstand der natürlichen Spracherkennung aus, um ein möglichst angenehmes Benutzererlebnis zu generieren.

Das Wissen hinter den User Interfaces

Über den Erfolg einer Anwendung entscheidet allerdings maßgeblich die Software dahinter – ganz unabhängig vom Interface. Für Anwendungen, die auf Künstlicher Intelligenz (KI) basieren, sind Daten das A und O.

Qualitativ hochwertige Daten bilden die Grundlage für eine starke KI. Diese kann sich allerdings nur weiterentwickeln, wenn der Datenbestand kontinuierlich steigt. Je intelligenter eine Anwendung ist, desto komplexere Aufgaben können mit ihr gelöst werden. Der Kreislauf ist in der Theorie einfach: Mehr Daten erleichtern die Entwicklung neuer, komplexerer Anwendungen. Neue Anwendungen wiederum generieren neue, belastbare Daten. Die größte Herausforderung in diesem Kreislauf besteht zurzeit darin, die Menge an Daten zu erfassen und zielführend auszuwerten. Hier ist die Expertise spezialisierter Data Scientists gefragt, um Daten in wertvolle Informationen, und diese wiederum in Erkenntnisse umzuwandeln.

In der Praxis basieren die meisten Anwendungen noch auf Machine-Learning-Algorithmen und nicht auf KI. Sie lernen also ständig dazu, sind aber nicht im eigentlichen Sinne intelligent. Eine wirkliche, der menschlichen Intelligenz ebenbürtige KI gibt es auf dem heutigen Stand der Technik noch nicht. Diese Tatsache begründet unter anderem eine der größten Herausforderungen in der KI-Forschung: Natural Language Understanding (NLU). NLU umfasst nicht nur die Fähigkeit einer Maschine, natürliche Sprache zu verarbeiten, sondern auch Input zu verstehen, der keinen definierten Regeln folgt. Mit Tonalitäten, unsauberer Aussprache, Dialekten oder auch Umgangssprache haben deshalb sowohl Chatbots als auch Voice-Assistenten noch immer Probleme.

Ausblick

Conversational Interfaces ermöglichen, im Vergleich zu anderen Interfaces, eine typische Konversation. Dank der Bedienung über natürliche Sprache nähert sich die User Experience der Mensch-Maschine-Interaktion so einen Schritt weiter an natürliche menschliche Interaktionen an. Je weiter die KI-Forschung voranschreitet, desto natürlicher, einfacher und umfangreicher werden die Möglichkeiten, die Sprachassistenten bieten. Unternehmen sollten folglich schon heute bei der technischen Entwicklung ihrer Anwendungen die Komponente „Voice“ mitdenken. Sonst hinken sie ihrer Konkurrenz schnell hinterher.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 45296004 / Künstliche Intelligenz)