Durchbruch auf dem Gebiet der KI Künstliche Intelligenz liest Gedanken

Von Dipl. Betriebswirt Otto Geißler 4 min Lesedauer

Anbieter zum Thema

Wissenschaftlern ist es erstmals gelungen, Gedanken in Text zu übersetzen. Dabei gelang es dem KI-Modell, den Kern der Gedanken der Probanden mit einer Genauigkeit von rund 80 Prozent zu identifizieren. Wie ist der Fortschritt auf dem Gebiet der Künstlichen Intelligenz einzuordnen?

KI ermöglicht nicht-invasives Gedankenlesen, indem Gedanken in Text umwandelbar wird.(Bild:  © peterschreiber.media - stock.adobe.com)
KI ermöglicht nicht-invasives Gedankenlesen, indem Gedanken in Text umwandelbar wird.
(Bild: © peterschreiber.media - stock.adobe.com)

Die Welt der Künstlichen Intelligenz (KI) entwickelt sich kontinuierlich weiter und es scheint, dass sich die sensationellen Durchbrüche in immer noch kürzeren Abständen ereignen. Einer der aktuellen Fortschritte in der KI ist die Fähigkeit, Gedanken mithilfe von KI-Technologien zu entschlüsseln. Das heißt, die Umwandlung von Gedanken in Text.

In dieser von Wissenschaftlern der University of Texas in Austin durchgeführten Studie wurden drei Teilnehmer gebeten, Podcasts anzuhören, während sie 16 Stunden lang in einem Scanner lagen. Nach dem Experiment behaupteten die Forscher, dass sie auch in der Lage seien, die Gedanken der Teilnehmer zu erzeugen, ohne dass eine Gehirnstimulation erforderlich sei.

Um dies zu erreichen, nutzten die Wissenschaftler das maßgeschneiderte KI-Sprachmodell GPT-1 als Decoder, ein Vorläufer von ChatGPT, das darauf trainiert wurde, die Gehirnaktivität mit Bedeutungen abzugleichen und in einen kontinuierlichen Textstrom umzuwandeln.

Studie mit fMRT-Daten

Während die Versuchspersonen einer Geschichte zuhörten oder sich alternativ stillschweigend eine vorstellten, rekonstruierte der Decoder die „gedachte Sprache“ mit überraschend hoher Genauigkeit. Mithilfe einer funktionellen Magnetresonanztomografie (fMRT) ist es gelungen, die Gehirnaktivität über den Sauerstoffgehalt des Blutes in den Neuronen zu erfassen.

Dank dieser nicht-invasiven Untersuchungsmethode ist es möglich, die Gehirntätigkeit bei unterschiedlichen Aufgaben zu dokumentieren. Frühere Systeme zur Sprachdekodierung erforderten noch chirurgische Implantate. Dieser Fortschritt eröffnet unter anderem die Aussicht auf neue Wege zur Wiederherstellung der Sprache bei Patienten, die beispielsweise aufgrund eines Schlaganfalls oder einer Motoneuron-Erkrankung unter Sprachstörungen leiden.

Obwohl die fMRT-Technologie zwar die Gehirnaktivität einem bestimmten Ort mit unglaublich hoher Auflösung zuordnen kann, sind jedoch inhärente Zeitverzögerungen zu beachten, die es unmöglich machen, die Aktivität in Echtzeit zu verfolgen. Solche Verzögerungen treten auf, weil fMRT-Scans die Reaktion des Blutflusses auf die Gehirnaktivität messen, die ihren Höhepunkt erreicht und innerhalb von etwa zehn Sekunden zum Ausgangswert zurückkehrt, was bedeutet, dass selbst der leistungsstärkste Scanner hier keine Verbesserung erzielen kann.

Diese Einschränkungen tragen dazu bei, die Gehirnaktivität als Reaktion auf natürliche Sprache zu interpretieren, da sie über mehrere Sekunden verteilt ein „Informationsgemisch“ entstehen lassen.

Präzision der KI-Technologie

Der Studie zufolge war das Modell allerdings in der Lage, Muster in der Gehirnaktivität zu erkennen und sie in Text zu übersetzen, wodurch eine Vorstellung davon vermittelt wurde, was die Probanden zu diesem Zeitpunkt dachten. Wobei die KI aber nicht in der Lage war, die Gedanken der Teilnehmer exakt zu erfassen, sondern lediglich eine Interpretation ihrer Gedanken.

Wenn einer der Versuchspersonen beispielsweise die Worte „Ich habe noch keinen Führerschein“ vorgespielt wurden, übersetzte das KI-Modell diese mit „Er hat noch nicht einmal damit begonnen, Autofahren zu lernen“. In einem anderen Fall waren es die Worte „Soll ich schreien, weinen oder weglaufen?“ Das KI-Modell kam stattdessen mit der Ausgabe: „Lass mich in Ruhe!“

Während sich die Probanden im Scanner befanden, wurden sie gebeten, sich vier kurze Videos ohne Vertonung anzusehen. Die KI war dazu in der Lage, einige der Inhalte genau zu beschreiben. Für eine nicht-invasive Methode ist das ein echter Fortschritt, verglichen mit den bisherigen Verfahren, die eher nur einzelne Wörter oder kurze Sätze hervorbrachte.

Manchmal hat die KI den falschen Teil eines Gedanken verstanden und hatte Probleme mit bestimmten Aspekten der Sprache, einschließlich Pronomen. Sie weiß zum Beispiel nicht, ob es sich um eine Perspektive der ersten oder dritten Person oder ein Mann oder eine Frau handelte. Warum die KI dabei ungenügende Resultate erzielte, ist noch weit gehend unbekannt.

Das KI-Modell war personalisiert und als es an einem anderen Probanden getestet wurde, war die Anzeige unverständlich. Es war aber auch gut möglich, dass die Versuchspersonen, an denen es trainiert wurde, das System durchkreuzten, indem sie beispielsweise an Tiere dachten oder sich in aller Stille eine andere Geschichte ausdachten.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Insgesamt konnte das KI-Modell demnach nur den Kern der Gedanken der Probanden mit einer Genauigkeit von etwa 80 Prozent identifizieren. Bei der Dekodierung der wahrgenommenen Sprache der Podcasts lag die Genauigkeit des Modells zwischen rund 70 und 80 Prozent. Bei der Dekodierung imaginärer Sprache sank die Präzision auf etwa 40 bis 75 Prozent. Die Fähigkeit, Stummfilme zu interpretieren, war mit einer Genauigkeitsrate von 20 bis 45 Prozent sogar noch geringer.

Fazit

Die Studie hat gezeigt, dass Sprachmodelle, die OpenAIs ChatGPT zugrunde liegen, völlig neue Wege eröffnen. Diese Modelle sind in der Lage, die semantische Bedeutung von Sprache in Zahlen darzustellen, sodass die Wissenschaftler untersuchen können, welche Muster neuronaler Aktivität vorliegen. Die Wortfolgen entsprechen dabei einer bestimmten Bedeutung, anstatt zu versuchen, die Gehirnaktivitäten Wort für Wort dazustellen.

Obwohl diese Resultate nicht sonderlich perfekt erscheinen, stellen sie dennoch einen bedeutenden Fortschritt auf dem Gebiet der KI und Gehirn-Computer-Schnittstellen dar. Die möglichen Anwendungen für solche Technologien sind daher auch sehr zahlreich. So könnten sich Auswirkungen auf Bereiche wie beispielsweise die Medizin, Neurowissenschaften und sogar die Justiz bemerkbar machen.

(ID:49877915)