Wissenschaftlern ist es erstmals gelungen, Gedanken in Text zu übersetzen. Dabei gelang es dem KI-Modell, den Kern der Gedanken der Probanden mit einer Genauigkeit von rund 80 Prozent zu identifizieren. Wie ist der Fortschritt auf dem Gebiet der Künstlichen Intelligenz einzuordnen?
KI ermöglicht nicht-invasives Gedankenlesen, indem Gedanken in Text umwandelbar wird.
Die Welt der Künstlichen Intelligenz (KI) entwickelt sich kontinuierlich weiter und es scheint, dass sich die sensationellen Durchbrüche in immer noch kürzeren Abständen ereignen. Einer der aktuellen Fortschritte in der KI ist die Fähigkeit, Gedanken mithilfe von KI-Technologien zu entschlüsseln. Das heißt, die Umwandlung von Gedanken in Text.
In dieser von Wissenschaftlern der University of Texas in Austin durchgeführten Studie wurden drei Teilnehmer gebeten, Podcasts anzuhören, während sie 16 Stunden lang in einem Scanner lagen. Nach dem Experiment behaupteten die Forscher, dass sie auch in der Lage seien, die Gedanken der Teilnehmer zu erzeugen, ohne dass eine Gehirnstimulation erforderlich sei.
Um dies zu erreichen, nutzten die Wissenschaftler das maßgeschneiderte KI-Sprachmodell GPT-1 als Decoder, ein Vorläufer von ChatGPT, das darauf trainiert wurde, die Gehirnaktivität mit Bedeutungen abzugleichen und in einen kontinuierlichen Textstrom umzuwandeln.
Studie mit fMRT-Daten
Während die Versuchspersonen einer Geschichte zuhörten oder sich alternativ stillschweigend eine vorstellten, rekonstruierte der Decoder die „gedachte Sprache“ mit überraschend hoher Genauigkeit. Mithilfe einer funktionellen Magnetresonanztomografie (fMRT) ist es gelungen, die Gehirnaktivität über den Sauerstoffgehalt des Blutes in den Neuronen zu erfassen.
Dank dieser nicht-invasiven Untersuchungsmethode ist es möglich, die Gehirntätigkeit bei unterschiedlichen Aufgaben zu dokumentieren. Frühere Systeme zur Sprachdekodierung erforderten noch chirurgische Implantate. Dieser Fortschritt eröffnet unter anderem die Aussicht auf neue Wege zur Wiederherstellung der Sprache bei Patienten, die beispielsweise aufgrund eines Schlaganfalls oder einer Motoneuron-Erkrankung unter Sprachstörungen leiden.
Obwohl die fMRT-Technologie zwar die Gehirnaktivität einem bestimmten Ort mit unglaublich hoher Auflösung zuordnen kann, sind jedoch inhärente Zeitverzögerungen zu beachten, die es unmöglich machen, die Aktivität in Echtzeit zu verfolgen. Solche Verzögerungen treten auf, weil fMRT-Scans die Reaktion des Blutflusses auf die Gehirnaktivität messen, die ihren Höhepunkt erreicht und innerhalb von etwa zehn Sekunden zum Ausgangswert zurückkehrt, was bedeutet, dass selbst der leistungsstärkste Scanner hier keine Verbesserung erzielen kann.
Diese Einschränkungen tragen dazu bei, die Gehirnaktivität als Reaktion auf natürliche Sprache zu interpretieren, da sie über mehrere Sekunden verteilt ein „Informationsgemisch“ entstehen lassen.
Präzision der KI-Technologie
Der Studie zufolge war das Modell allerdings in der Lage, Muster in der Gehirnaktivität zu erkennen und sie in Text zu übersetzen, wodurch eine Vorstellung davon vermittelt wurde, was die Probanden zu diesem Zeitpunkt dachten. Wobei die KI aber nicht in der Lage war, die Gedanken der Teilnehmer exakt zu erfassen, sondern lediglich eine Interpretation ihrer Gedanken.
Wenn einer der Versuchspersonen beispielsweise die Worte „Ich habe noch keinen Führerschein“ vorgespielt wurden, übersetzte das KI-Modell diese mit „Er hat noch nicht einmal damit begonnen, Autofahren zu lernen“. In einem anderen Fall waren es die Worte „Soll ich schreien, weinen oder weglaufen?“ Das KI-Modell kam stattdessen mit der Ausgabe: „Lass mich in Ruhe!“
Während sich die Probanden im Scanner befanden, wurden sie gebeten, sich vier kurze Videos ohne Vertonung anzusehen. Die KI war dazu in der Lage, einige der Inhalte genau zu beschreiben. Für eine nicht-invasive Methode ist das ein echter Fortschritt, verglichen mit den bisherigen Verfahren, die eher nur einzelne Wörter oder kurze Sätze hervorbrachte.
Manchmal hat die KI den falschen Teil eines Gedanken verstanden und hatte Probleme mit bestimmten Aspekten der Sprache, einschließlich Pronomen. Sie weiß zum Beispiel nicht, ob es sich um eine Perspektive der ersten oder dritten Person oder ein Mann oder eine Frau handelte. Warum die KI dabei ungenügende Resultate erzielte, ist noch weit gehend unbekannt.
Das KI-Modell war personalisiert und als es an einem anderen Probanden getestet wurde, war die Anzeige unverständlich. Es war aber auch gut möglich, dass die Versuchspersonen, an denen es trainiert wurde, das System durchkreuzten, indem sie beispielsweise an Tiere dachten oder sich in aller Stille eine andere Geschichte ausdachten.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
Insgesamt konnte das KI-Modell demnach nur den Kern der Gedanken der Probanden mit einer Genauigkeit von etwa 80 Prozent identifizieren. Bei der Dekodierung der wahrgenommenen Sprache der Podcasts lag die Genauigkeit des Modells zwischen rund 70 und 80 Prozent. Bei der Dekodierung imaginärer Sprache sank die Präzision auf etwa 40 bis 75 Prozent. Die Fähigkeit, Stummfilme zu interpretieren, war mit einer Genauigkeitsrate von 20 bis 45 Prozent sogar noch geringer.
Fazit
Die Studie hat gezeigt, dass Sprachmodelle, die OpenAIs ChatGPT zugrunde liegen, völlig neue Wege eröffnen. Diese Modelle sind in der Lage, die semantische Bedeutung von Sprache in Zahlen darzustellen, sodass die Wissenschaftler untersuchen können, welche Muster neuronaler Aktivität vorliegen. Die Wortfolgen entsprechen dabei einer bestimmten Bedeutung, anstatt zu versuchen, die Gehirnaktivitäten Wort für Wort dazustellen.
Obwohl diese Resultate nicht sonderlich perfekt erscheinen, stellen sie dennoch einen bedeutenden Fortschritt auf dem Gebiet der KI und Gehirn-Computer-Schnittstellen dar. Die möglichen Anwendungen für solche Technologien sind daher auch sehr zahlreich. So könnten sich Auswirkungen auf Bereiche wie beispielsweise die Medizin, Neurowissenschaften und sogar die Justiz bemerkbar machen.