Maschinelle Spracherkennung auf menschlichem Niveau

5.1 Prozent. Das ist die durchschnittliche Fehlerquote für das Wortverständnis eines Menschen in einer Unterhaltung. Forschern der Microsoft Speech and Dialog Research Group ist es nach 25 Jahren jetzt gelungen, diesen Wert mit computerbasierter Spracherkennung zu erreichen. Geklappt hat das mit Hilfe eines faltungscodierten neuronalen Netzes in Kombination mit einem bidirektionalen long-short-term memory. Ein Meilenstein für die Technologie. Der nächste große Schritt für die Forscher ist es jetzt, die neuronalen Netzwerke so auszurichten, dass sie die erkannten Wörter verstehen können.
Wir gratulieren den Forschern der Microsoft Speech and Dialog Research Group zu ihrer großartigen Arbeit.
Lesen Sie hier den gesamten Artikel.