Kommentar von Andrey Schukin, Interprefy Macht Künstliche Intelligenz Dolmetscher überflüssig?

Von Andrey Schukin 4 min Lesedauer

Anbieter zum Thema

Künstliche Intelligenz (KI) verändert den mehrsprachigen Zugang bei internationalen Events, doch menschliche Kontrolle bleibt entscheidend, um Kontext, Nuancen und Vertrauen zu gewährleisten.

Der Autor: Andrey Schukin ist Chief Product and Technology Officer bei Interprefy(Bild:  Interprefy)
Der Autor: Andrey Schukin ist Chief Product and Technology Officer bei Interprefy
(Bild: Interprefy)

Remote Simultaneous Interpretation (RSI) ist seit langem eine bewährte Lösung für Veranstalter, die ihre Events mehrsprachig gestalten möchten. Der Einsatz erfahrener, qualifizierter Dolmetscher bei großen, komplexen und nuancenreichen Veranstaltungen stellt dabei einen erheblichen Mehrwert dar.

Mit dem technologischen Fortschritt haben jedoch KI-gestützte Sprachübersetzungsdienste, wie Audioübersetzungen und Live-Untertitel, ein Genauigkeitsniveau erreicht, das für die meisten Teilnehmer ausreichend ist und das bei deutlich geringeren Kosten sowie wesentlich einfacheren logistischen Anforderungen. Diese Faktoren treiben die zunehmende Verbreitung KI-basierter Live-Übersetzungen maßgeblich voran.

KI ist in der Lage, gesprochene Inhalte in Echtzeit zu transkribieren, zu übersetzen und bereitzustellen. Dadurch können Veranstalter internationale Zielgruppen in großem Maßstab erreichen, ohne hohe Betriebskosten in Kauf nehmen zu müssen. Doch auch wenn sich die Fähigkeiten KI-gestützter Sprachübersetzung stetig verbessern, ist Sprache weit mehr als reine Syntax, sie umfasst Botschaft, Logik, Tonfall und Kontext.

Wir sind davon überzeugt, dass die Zukunft in einer „Hybrid Intelligence“ liegt, die Mensch und KI kombiniert. KI kann zwar mehrsprachige Events auf ein neues Niveau heben, weist aber auch Einschränkungen auf.

Kontextuelle Herausforderungen

Dank neuronaler maschineller Übersetzung und fortschrittlicher Spracherkennungsmodelle verringert sich die Qualitätslücke zwischen KI und menschlicher Übersetzung in bestimmten Anwendungsfällen zunehmend. Dennoch stoßen aktuelle KI-gestützte Sprachübersetzungen bei komplexen und nuancierten Inhalten häufig an ihre Grenzen. Der Grund: Die korrekte Interpretation im jeweiligen Kontext, insbesondere bei der Übertragung von einer Sprache in eine andere, ist äußerst anspruchsvoll.

Obwohl Fortschritte bei kontextsensitien KI-Modellen und Retrieval-Augmented Generation vielversprechend sind, verfügen viele KI-Übersetzungstools weiterhin nur über ein begrenztes Kontextgedächtnis. Das erhöht das Risiko von sogenannten Halluzinationen und Ungenauigkeiten. Selbst mit erweitertem Kontext bleibt Konsistenz eine Herausforderung, da KI oft nicht in der Lage ist, komplexe oder vielschichtige Aussagen vollständig zu erfassen.

Eine vollständig präzise KI-Sprachübersetzung würde eine Artificial General Intelligence (AGI) voraussetzen, eine Form von KI, die es derzeit, auch bei Large Language Models, noch nicht gibt. Die Echtzeit-Anforderungen bei Veranstaltungen verschärfen diese Problematik zusätzlich, da LLMs naturgemäß am besten mit vollständigen und abgeschlossenen Eingaben arbeiten, was bei spontaner menschlicher Sprache nicht gegeben ist.

Das bedeutet jedoch nicht, dass KI nicht in der Lage ist, in klar definierten Kontexten präzise Audioübersetzungen zu liefern. Insbesondere bei standardisierten Geschäftsinhalten, Präsentationen mit etablierter Terminologie oder klar strukturierten Reden kann die Qualität der KI-Übersetzung durchaus mit der menschlicher Dolmetscher konkurrieren. Bei kritischen, kulturell sensiblen oder hochspezialisierten Veranstaltungen bleibt die Expertise menschlicher Dolmetscher jedoch unverzichtbar, idealerweise in Kombination mit KI.

Ein Beispiel für ein solches hybrides Modell, menschliche Übersetzungsleistung für Nuancen, KI für Skalierbarkeit, ist ein 25-stündiges Live-Event in 70 Sprachen, bei dem 14 menschliche Übersetzungskanäle mit 55 zusätzlichen KI-gestützten Kanälen kombiniert wurden. So konnten 53.000 Teilnehmer in 192 Ländern erreicht werden. Dieses Beispiel verdeutlicht eindrucksvoll das Potenzial hybrider Intelligenz aus Mensch und KI.

Das ideale Modell hybrider Intelligenz

Die optimale Zusammenarbeit zwischen menschlichen Experten und KI-gestützter Interpretation stellt sicher, dass die vollständige Botschaft jeder Präsentation konsistent und ohne Qualitätsverluste vermittelt wird.

Ein solches Modell ermöglicht zudem eine Echtzeit-Qualitätskontrolle: KI kann potenzielle Probleme erkennen und zur Überprüfung markieren, während menschliche Experten Feedback liefern, das die Leistung der KI kontinuierlich verbessert.

Auch bei dicht getakteten Veranstaltungsprogrammen sollte ein durchgängig reibungsloser Ablauf gewährleistet sein. Einige Inhalte werden weiterhin von menschlichen Dolmetschern betreut, während andere durch KI-basierte Sprachübersetzung abgedeckt werden können. Mit der Weiterentwicklung der KI, insbesondere im Hinblick auf Fachterminologie, kulturelle Nuancen und individuelle Sprechweisen, wird sich die Aufgabenverteilung zwischen Mensch und Maschine zunehmend dynamisch und effizient gestalten.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Darüber hinaus ermöglicht dieser Ansatz eine flexible Anpassung an die Bedürfnisse der Teilnehmer. In Kombination mit cloudbasierten RSI-Plattformen kann die nahtlose Integration von menschlichen Dolmetschern und KI-Übersetzung eine Win-win-Situation schaffen: hochwertige Sprachmittlung in großem Maßstab zu Kosten, die im Rahmen bleiben.

Balance zwischen Kosten und Inklusion

KI eröffnet Veranstaltern neue Möglichkeiten und erweitert das Spektrum an verfügbaren Sprachoptionen für das Publikum. So erlaubt die Kosteneffizienz von KI beispielsweise, auch kleinere Sessions oder Breakout-Räume mehrsprachig anzubieten. Formate, bei denen sich der Einsatz menschlicher Dolmetscher bislang oft nicht gerechnet hätte.

Dennoch sollten Veranstalter bei der Bewertung rein KI-basierter Lösungen stets darauf achten, die Systeme mit Inhalten zu testen, die dem geplanten Event möglichst nahekommen und dies auch über längere Zeiträume hinweg. Viele KI-Tools zeigen Qualitätsverluste bei längerer Nutzung oder stoßen bei schneller Sprechweise an ihre Grenzen. Klare Qualitätsbenchmarks helfen dabei, sicherzustellen, dass die Erwartungen erfüllt werden, bevor die Lösung live eingesetzt wird.

Eine universelle Lösung für alle Eventformate gibt es nicht. Je nach Art der Veranstaltung, Thema oder Sprecher kann eine KI-basierte Übersetzung mehr oder weniger geeignet sein. Gleiches gilt für RSI. Auch die Erwartungen der Zielgruppen variieren stark. In Kombination mit dem Risiko von Fehlinvestitionen unterstreicht dies die Bedeutung eines sorgfältigen Testens vor der finalen Entscheidung.

Ohne AGI bleiben menschliche Dolmetscher unerlässlich

Die Entwicklung von KI lässt erwarten, dass sich die Übersetzungsqualität in den kommenden Jahren weiter deutlich verbessern wird, insbesondere durch Fortschritte bei Echtzeitverarbeitung sowie beim Verständnis von Kontext, Tonalität und kulturellen Feinheiten. Bis jedoch AGI Realität und breit verfügbar ist, bleibt die Rolle menschlicher Dolmetscher zentral.

Für optimale Ergebnisse empfiehlt es sich, gezielt zu bestimmen, wo KI-gestützte Sprachübersetzung sinnvoll eingesetzt werden kann und diese mit der Expertise erfahrener Dolmetscher zu kombinieren. So lassen sich inklusive Veranstaltungen skalieren und gleichzeitig die Kosten für Mehrsprachigkeit deutlich reduzieren.

Mit zunehmender Reife der Technologie werden Organisationen, die bereits heute in hybride Ansätze investieren, am besten positioniert sein, um ihre mehrsprachigen Strategien künftig weiterzuentwickeln und zu optimieren.

(ID:50796104)