Summetix Mit Argument Mining Fake News und mehr entdecken

Von Michael Matzer Lesedauer: 5 min

Anbieter zum Thema

Mit Argument Mining und großen Sprachmodellen aus Deep Learning will das deutsche Start-up Summetix, das an der TU Darmstadt entstand, verstecktes Wissen im Kundenfeedback identifizieren, gruppieren und sogar monetär bewerten. Anwendungsbereiche sind der Kundenservice, Trendsuche, Wissensauswertung und Produktentwicklung. Summetix lässt sich mit ChatGPT-4 integrieren.

In diesem Dashboard kann der Summetix-Nutzer einen Suchbegriff in der gewählten Sprache (EN) eingeben.
In diesem Dashboard kann der Summetix-Nutzer einen Suchbegriff in der gewählten Sprache (EN) eingeben.
(Bild: Summetix)

Das menschliche Wissen wächst weltweit rasch an, sodass es schwieriger wird, diese Dokumente zu durchsuchen und für die eigenen Zwecke auszuwerten. Die Firma Summetix hat in jahrelanger Arbeit eine KI-Technologie entwickelt, um unstrukturierte Daten wie etwa Kundenfeedback in E-Mails, Informationen in wissenschaftlichen Artikeln und Online-Informationen auszuwerten. So lassen sich wichtige Trends bereits frühzeitig aufspüren. Bei Kundenbeschwerden etwa lassen sich rechtzeitig Maßnahmen ergreifen, um größeren Schaden abzuwenden.

Anwendungsbereiche sind die Social-Media-Analyse, die Aussagen darüber machen kann, welche Stärken und Schwächen der eigenen Produkte von den Kunden genannt werden. Des Weiteren lassen sich Fehler quantifizieren, um sagen zu können, wie häufig Probleme bzw. Fehlerbilder auftreten. Auch Signale und Benachrichtigungen lassen sich auslösen. Summetix-Analysen können Aussagen machen wie etwa „Welches Produkt zeigt einen besonderen Anstieg/Verschiebung in der Berichterstattung – und was sind die Ursachen für die Veränderungen?“

Bildergalerie
Bildergalerie mit 6 Bildern

Bisherige Ansätze in der Text- oder Social-Media-Analyse können feststellen, ob sich das Customer-Feedback verbessert oder verschlechtert. Mit Summetix ist es zudem möglich, die konkreten Ursachen automatisch aus 100.000 Quellen zu extrahieren. Am Anfang des Verfahrens stehen die Schritte Filtern und Aggregieren, dann folgen Vergleichen, Korrelieren und schließlich Messen. Im Prozessschritt des Messens wird der wirtschaftliche bzw. finanzielle Wert eines Sachverhalts oder Befundes („monetary impact“) beziffert. Schnell zeigt sich also, welche Werte man mit diesem Verfahren schöpfen kann.

Die Software liest nach Angaben von CEO Erik Kaiser tausend Mal schneller als der Mensch, aber ohne dabei an Genauigkeit zu verlieren. Das ist angesichts der enormen Datenmengen, um die es vielfach geht, hilfreich. „Wir reduzieren die zu analysierende Textmenge um 90 Prozent. So erhält der Nutzer bis zu sechs Monate schneller als mit anderen Verfahren entscheidungskritische Informationen, um Probleme zu beheben oder die Reputation eines Unternehmens zu schützen. Insbesondere durch die Nutzung von Social-Media-Daten haben wir gegenüber kundeninternem Customer Feedback (E-Mails, Umfragen etc.) wesentliche Vorteile.“

Zum einen könne Summetix im Bereich Consumer Intelligence deutlich mehr Daten analysieren, sodass der Nutzer ein vollständiges Bild aller Feedbacks, beispielsweise auf den Social-Media-Kanälen, erhalten und zudem bisher unbekannte Probleme aufdecken könne. „Unsere Argument-Mining-Technologie“, erläutert Kaiser, „identifiziert die Themen, die wirkliche Erkenntnisse versprechen. Diese Insights liefert Summetix in Sekundenschnelle und in weltweit führender Genauigkeit.“

Die Technologie

Das Augenmerk der KI-Anwendung liegt dabei auf Argument Mining. Dieses Verfahren wurde unter anderem am Ubiquitous Knowledge Processing (UKP) Lab an der Technischen Universität Darmstadt entwickelt. Es wurde von der führenden NLP-KI-Forscherin Iryna Gurevych gegründet. Sie ist u. a. Präsidentin der Association for Computational Linguistics. Das Mission Statement des UKP Lab lautet: „Das UKP Lab forscht im Deep-Learning-Segment an Natural Language Processing (NLP), wo der Schwerpunkt stark auf Conversational AI, Fragenbeantwortung, Dokument-übergreifendem NLP sowie neuartigen Datenmengen und Problemdefinitionen liegt.“

Die Algorithmen der Association for Conversational Linguistics befinden sich natürlich auf dem neuesten Forschungsstand. Dazu gehört die Klassifizierung und das Clustering von Argumenten mit kontextualisiertem Einbetten von Wörtern, das themenübergreifende Argument Mining aus heterogenen Quellen und ein Haltungserkennungs-Benchmark. Dieses Stance Detection Feature ist für die Erkennung von Fake News, Hate Speech, Prüfung von Behauptungen und Argumentsuche. Leider, so Erik Kaiser, „lassen Machine-Learning-Methoden in diesem Bereich noch viel zu wünschen übrig, weil sie nur anhand einer einzelnen Datenquelle trainiert werden. Aber mit unserem neuen Machine Learning Benchmark können Nutzer wenigstens die verschiedenen StD-Modelle miteinander vergleichen.“ Zudem habe Summetix ein Multi-Dataset Learning (MDL) mit zehn Datenquellen unterschiedlicher Herkunft erstellt, womit sich validere Aussagen machen lassen. Weitere Datenmengen und Prüfmethoden lassen sich integrieren. Weil es der Methode immer noch an der Robustheit gegenüber Manipulationen mangele, suche Summetix nun Partner, um in diesem bedeutsamen Bereich Hilfe zu erhalten.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

Auch im nächsten Schritt, dem Argument Clustering, finden bekannte Algorithmen wie SBERT Anwendung. Zudem ermöglicht es Summetix, mithilfe des Sprachmodells Arg-CTL selbst Argumente zu erstellen.

Im Bereich Monitoring und Trenderkennung lässt sich ein Szenario für die generalisierte Suche auf der vorhandenen Infrastruktur nutzen. Erik Kaiser: „Unsere skalierbare Infrastruktur verarbeitet riesige Textmengen in Rekordzeit.“ Seine Firma habe die ursprüngliche ArgumenText-Software im Hinblick auf die Unterstützung von Entscheidungen im Innovationsmanagement und auf Kunden-Feedback, wie etwa Buchrezensionen, getestet. Aus dieser Forschungsarbeit seien verschiedene Data Sets hervorgegangen, die Summetix u. a. auf GitHub veröffentlicht habe. „Summetix ist für verschiedene Sprachen erhältlich“, berichtet Kaiser: Deutsch, Französisch, Spanisch und Chinesisch. Deshalb sei nun auch die maschinelle Übersetzung realisierbar.

Anwenderstimmen

Das Produkt ist bereits bei führenden Konsumgüterherstellern und Automobilherstellern im Einsatz, so etwa bei BMW und Melitta. „Mithilfe der Argument-Mining-Lösung des Deep Learning Start-ups Summetix können wir wesentliche Informationen aus den Sozialen Medien extrahieren“, sagt Davide Cadamuro, KI-Architekt in der BMW Group IT. „Daraus kann unsere Qualitätssicherung und Produktentwicklung konkrete Handlungsanweisungen ableiten, um unsere Produkte sowie die Customer Experience zu optimieren.“

„Durch die Zusammenarbeit mit Summetix wollten wir einen einzigartigen Beitrag zur Bundestagswahl 2021 leisten“, berichtet Tobias Kehl, Project Lead AI Start-up Rising at hessian.ai: „Über die KI-Technologie des Unternehmens konnten wir die gesamte Berichterstattung rund um die Bundestagswahl analysieren und Standpunkte sowie Argumente von politischen Akteuren zu beliebigen Themen darstellen. Das frei zugängliche Tool hat viele Wähler dabei unterstützt, sich auf Basis der eigenen Prioritäten unabhängig und vielseitig zu informieren.“

„Der explorative Ansatz von Summetix, um die Färbung und Argumentation in Online-Nachrichten aufzudecken, liefert Ergebnisse, die unserem Analyseansatz sehr nahe kommen und das äußerst schnell, in wenigen Minuten statt Tagen“, konstatiert Oliver Heyden, Chief Strategy Officer bei Pressrelations.

Partner

„Wir partnern mit Zühlke und T-Systems, um unsere Infrastruktur schneller ausrollen zu können“, sagt CEO Erik Kaiser, „und wir partnern mit Pressrelations, um unsere Kundinnen und Kunden mit hochwertigen Textdaten beliefern zu können.“

„Die Möglichkeiten, mit Summetix große Datenmengen vorzufiltern und kundenspezifisches Feedback in das Modell einzuspeisen, ist ein großer Vorteil“, fasst Kaiser zusammen und geht auf Generative KI ein: „So lassen sich die wesentlichen Probleme von bisherigen LLMs wie etwa ChatGPT-4, wie etwa Halluzinationen und mangelnde Nachvollziehbarkeit der gelieferten Ergebnisse, gezielt lösen.“

(ID:49685193)