Suchen

Neue Microsoft Cognitive Services Bessere Spracherkennung für Software-Entwickler

| Redakteur: Stephan Augsten

Drei neue kognitive Microsoft-Dienste sollen Software-Entwicklern die einfache Integration verschiedener Spracherkennungs-Funktionen per REST API ermöglichen. Ein Custom Speech Service unterscheidet Fachsprache und Dialekte, die Bing Speech API kann Sprache und Text in beide Richtungen umwandeln.

Firmen zum Thema

Die Microsoft Cognitive Services sollen Software mit Künstlicher Intelligenz anreichern, um die Spracherkennung zu verbessern.
Die Microsoft Cognitive Services sollen Software mit Künstlicher Intelligenz anreichern, um die Spracherkennung zu verbessern.
(Bild: geralt - Pixabay.com / CC0 )

Der ab sofort verfügbare Custom Speech Service soll dazu dienen, Dienste zur Spracherkennung an verschiedene Bedingungen anzupassen. Microsoft baut dabei auf den Erfahrungen mit der Speech Recognition API auf, die basierend auf einem neuronalen Netzwerk eigenständig Sprache verstehen lernt.

Mithilfe der KI (Künstliche Intelligenz) generierte Sprachmodelle müssen erst an verschiedene Rahmenbedingungen angepasst werden, wie Microsoft erläutert: „Ob ein Geräusch ein Wort oder eine Hydraulikpresse ist, mag für Menschen einfach zu entscheiden sein. Maschinen müssen diesen Unterschied erst lernen – um das künftig dann zuverlässig zu erkennen.“

Genau hier kommt der Custom Speech Service zum Tragen. Er hilft Anwendungen und Embedded Software dabei, Dialekte und Fachsprache zu erkennen sowie Störgeräusche herauszufiltern.

Eine weitere Hilfestellung bei der Spracherkennung soll die Bing Speech API geben. Der Dienst wandelt Audiomaterial in Text um, kann auf umgekehrtem Wege ebenso Texte aus gesprochener Sprache generieren und soll letztlich sogar den Inhalt verstehen.

Der dritte Dienst, der sich in die Sammlung der mittlerweile 25 Microsoft Cognitive Services einreiht, ist der sogenannte Content Moderator. Mit ihm soll es möglich sein, Texte, Bilder oder Videos nach unerwünschtem Material zu durchsuchen und etwa Gewaltszenen oder hetzerische Sprache herauszufiltern.

Artikelfiles und Artikellinks

(ID:44515059)