Rückblick auf die AI-Events im März 2018

Rückblick auf die AI-Events im März 2018

Rückblick ESSV 2018, Ulm
Konferenz Elektronische Sprachsignalverarbeitung

Vom 07. – 09.03.2018 fand die ESSV, Konferenz für Elektronische Sprachsignalverarbeitung, erstmals in der Universitätsstadt Ulm statt. Die Veranstaltung diente dazu, Experten der Sprachtechnologie-Forschung und -Anwendung zusammenzubringen. Dass die an der Donau gelegene Stadt Ulm in diesem Jahr als Konferenzort ausgewählt wurde, ist kein Zufall. Bereits in den 70er Jahren wurden hier bei der AEG-Telefunken die ersten Sprachausgabe- und Spracherkennungssysteme entwickelt.

Als Vertreter der Deutschen Telekom nahm Dr. Felix Burkhardt, Experte für Text, Sprache und Sprachtechnologien an diesem Event teil. Seine Mission: Kontakte zu Fachkollegen zu knüpfen, Forschungsergebnisse auszutauschen und Informationen zum aktuellen Forschungsstand deutscher Universitäten zu sammeln.

Eröffnet wurde das dreitägige Event mit einem Grußwort des Präsidenten der Universität Ulm, Prof. Dr.-Ing. Michael Weber. Anschließend übergab er das Wort an Geert-Jan Kruijff, Technischer Product Manager bei Nuance Communications. Die Firma Nuance Communications entwickelt Gesamtlösungen für die Sprachbedienung im Fahrzeug, von der akustischen Vorverarbeitung bis zum Sprachdialog. In seinem Vortrag stellte Kruijff die grundlegenden Technologien und Fähigkeiten vor, die notwendig sind, um einen mobilen kognitiven Assistenten zum Leben zu erwecken.

Rund um das Thema Sprachassistenz drehten sich auch die darauf folgenden Beiträge von Vertretern der Daimler AG. Die Daimler AG erforscht und entwickelt ihre eigenen Sprachbediensysteme – vom Design der Dialoge bis hin zum Test im Fahrzeug. Präsentiert wurden beispielsweise die Ergebnisse einer explorativen Internetstudie zu Multi-Intents in Sprachdialogsystemen. Mit Hilfe von grafischen Anweisungen wurden spontane Nutzeräußerungen gesammelt. Die Aufgaben bewegten sich alle im Bereich des automatisierten Fahrens und verlangten von den Probanden eine variierende Anzahl an Absichten in einer Äußerung zu formulieren. Die Analyse der Äußerungen mit mehr als einer Intention offenbarte Hinweise, dass nicht nur der Dialogeinstieg als Kontext für Multi-Intent-Äußerungen relevant sein kann. [1]

Am zweiten Tag kamen vor allem Sprecher verschiedenster Universitäten zu Wort und stellten Ihre Forschungsergebnisse vor. Besonders beeindruckend fand Dr. Felix Burkhardt den Beitrag von Stefan Ultes. Der wissenschaftliche Mitarbeiter der University of Cambridge gab in seinem Vortrag „Towards Natural Spoken Interaction with Artificial Intelligent Systems“ einen schönen Überblick darüber, wie neuronale Netze in der Sprachtechnologie eingesetzt werden können.

Am dritten und damit letzten Tag der Veranstaltung trat Dr. Felix Burkhardt selbst ans Rednerpult. Sein Vortrag „Ironic Speech – Evaluating acoustic correlates by means of speech synthesis“ befasste sich mit einem Ansatz zur Bewertung akustischer Korrelate ironischer Sprache mittels Sprachsynthese. In Form eines web-basierten Hörversuchs wurden vier verschiedene Merkmale untersucht, die in der deutschen Sprache auf ironisch gemeinte Äußerungen hinweisen: übertriebene Artikulation, Überbetonung der Hauptsilbe, Anhebung der Tonhöhe am Ende des Satzes und Sprechen mit extrem geringer Erregung. Das Ergebnis des Experiments: alle vier Merkmale prosodischer Signalisierung von Ironie führten zu einer Präferenz gegenüber der Standardversion. Folglich trägt die Erkennung und Erzeugung ironischer Sprechweise zur Verstärkung der Natürlichkeit und Vereinfachung sprachlicher Mensch-Maschine Kommunikation bei.

Am frühen Nachmittag wurde die Veranstaltung vom Ausrichter der nächsten ESSV mit einem Schlusswort beendet. Für die DeutscheTelekom nahm Dr. Felix Burkhardt folgende Erkenntnis mit: „Was die Technologie betrifft, arbeiten wir im Projekt eLIZA auf dem Stand der aktuellen Forschung. Dies betrifft vor allem die Unterstützung regelbasierter Datenverarbeitung durch maschinengelernte Verfahren, insbesondere künstlicher neuronaler Netze.“

-----------------------------------------------------------------------------------------

Quellenangaben:

[1] Daimler AG: Explorative Untersuchung von Multi-Intents in Sprachdialogsystemen
(abgerufen am 03.05.2018)

Kommentare
Einen Kommentar schreiben
Entschuldigung

Ihr Browser ist leider nicht aktuell genug.
Um diese Webseite zu benutzen, benötigen Sie einen aktuellen Browser
Wir empfehlen einen der folgenden Browser in der aktuellsten Version zu installieren.

Auf iOS Geräten sollte mindestens die Betriebssystem Version iOS 9 installiert sein.

Mozilla Firefox Google Chrome Microsoft Edge Internet Explorer