Dialog mit dem unsichtbaren Jeeves

von Anton Ivanov, Regional Development Director der Spitch AG

Der Dialog zwischen Mensch und Maschine ist bereits jetzt Realität. Aber wohin führt das? Führen technologische Entwicklungen dazu, dass Roboter-Berater und persönliche Assistenten letzten Endes gewissermaßen menschliche Eigenschaften annehmen? Dabei geht es im Kern um künstliche Intelligenz (KI) – aber auch um Stimmmodulation und eine passende Synchronstimme, die Gefühle anspricht. Die Antworten darauf sind noch unklar. Doch es ist absehbar, was den zukünftigen Verlauf des technologischen Fortschritts und der Marktentwicklungen prägen wird: Nämlich die Fähigkeit, menschliche Grundbedürfnisse und Interessen in den Mittelpunkt des gesamten Ökosystems zu stellen und diese in Bezug auf Kosten, Geschwindigkeit und Qualität bestmöglich zu befriedigen. Dieser Prozess wird offensichtlich durch maschinelles Lernen in einem Echtzeit-Dialog über ein Voice User Interface (VUI) angetrieben werden.


Worum geht es in diesem Dialog?

Ein unsichtbarer und eher unauffälliger Jeeves, der auf die täglichen Bedürfnisse eines typischen Woosters von heute reagiert? Die meisten Prognosen konzentrieren sich auf die Automatisierung von Lifestyle-Diensten, wie grundlegende Finanzplanung – von der Überweisung von Ersparnissen auf ein Konto mit höheren Zinsen bis hin zum Risikoausgleich des Portfolios, dem Bestellen von Speisen und Haushaltswaren oder der Nutzung eines VUI für die sprachgesteuerte Programmierung von IdD-Geräten (Internet der Dinge). Dabei geht es um alle alltäglichen Bedürfnisse, und zwar: das Buchen von Hotels und die Organisation von Restaurantbesuchen mit Freunden, Reisen, Sport, die Nutzung von Gesundheitsdiensten, Planung und Bezahlung der Ausbildung, Versicherungen etc. Auch die Beratung zum Stil eines Kleides oder zu einem Geschenk ist dabei eine Möglichkeit. Eine kontinuierliche Hintergrundanalyse der persönlichen Entscheidungen und Präferenzen sowie die intelligente Nutzung von Statistiken und Big Data (einschließlich unstrukturierter Daten) stehen hinter einem Kosten-Qualitäts-Verhältnis, das der beste menschliche PA so niemals realisieren könnte. Kommunikationspsychologie, Sentiment-Analyse (Gefühlsanalyse) und exzellente Gesprächsführung werden wahrscheinlich zu den Methoden für erstklassige Performance gehören.


Es beginnt mit einem einfachen sprachgesteuerten Dialogsystem (Interactive Voice Response)
, bei dem ein Kunde eines Telefonanbieters oder einer Bank nicht in der Leitung warten und sich alle komplexen Menüoptionen eines altmodischen DTMF-Sprachdialogsystems (Dual Tone Multiple Frequency: Tonsignal an die Telefongesellschaft, das man durch Drücken einer normalen Taste des Telefons erzeugt) anhören muss, wobei er möglicherweise die ersten paar Optionen beim Anhören der letzten Optionen bereits wieder vergessen hat. Stattdessen sagt der Anrufer einfach, was er möchte. Die Maschine geht dann darauf ein, denn sie ist speziell darauf ausgerichtet, alle möglichen Arten und Formen zu verstehen, wie der Grund für den Anruf formuliert, artikuliert und zum Ausdruck gebracht werden kann. Das System kann zudem verstehen, ob man mit dem Dienst zufrieden ist oder nicht.

Spracherkennung und -analyse, semantische Interpretationen und Techniken der Gefühlserkennung, die für Kontextverständnis sorgen, machen diesen Dialog möglich. Zudem sorgen sprachbiometrische Lösungen für die Identitätsverifizierung und Authentifizierung bei der Verarbeitung vertraulicher Daten oder Finanzinformationen. Die nächsten Schritte bei der Weiterentwicklung des Mensch-Maschine-Dialogs werden voraussichtlich von neuen Ansätzen vorangetrieben, mithilfe derer KI kreatives Denken und emotionale Intelligenz nachahmen kann, um auf komplexe Gefühle und seelische Zustände einzugehen.


Was sind die größten Schwierigkeiten dabei?

Die Genauigkeit der Spracherkennung ist noch nicht zu 100 % zufriedenstellend – ganz zu schweigen von der vollständigen Sinnerfassung auf die gleiche Weise wie ein Mensch. Hinzu kommen nur wenig Fortschritte in Bezug auf Geräuschfilterung und im Umgang mit unbekannten akustischen Umgebungen oder die Nachahmung von Gefühlen durch Text-to-Speech-Systeme (Sprachausgabe), um nur einige Schwierigkeiten zu nennen. Nach dem derzeitigen Stand der Dinge erfordert es für die Überwindung der meisten dieser Hürden Innovationen im Bereich Algorithmen und die richtige Datenmenge für maschinelles Lernen. Technologien, wie die der Spitch AG, sorgen für die größtmögliche Genauigkeit, wenn sie auf Basis einer enormen Menge an Audio-Daten von Kunden geschult werden – also von denselben Endnutzern, die später die Produkte nutzen, die auf Basis dieser Technologien entwickelt werden.


Mögliche Bedenken:

  1. Kann die KI der Maschinen Menschen schaden?
  2. Können wir uns selbst Schaden zufügen, wenn wir die Maschinen mit KI wie Sklaven behandeln?

In diesem Zusammenhang stellt sich eine eher philosophische Frage: Gilt künstliche Intelligenz – wenn/falls sie sich vollständig realisieren lässt – als eine Form halbautonomen künstlichen Lebens und Persönlichkeit, was dazu führt, dass wir eine neue Art der Ethik verfolgen? Oder sind hier allgemeine Moralvorstellungen in Bezug auf zwischenmenschliche Beziehungen anwendbar? In absehbarer Zukunft ist KI weiterhin vollständig von der Programmierung durch den Menschen abhängig und kaum zu eigenständigem Denken und Handeln in der Lage. Die einzige realistische Konzeptualisierung der Gefahr ist im Zusammenhang mit menschlichen Fehlern möglich, zum Beispiel wenn Automatisierung die Kontrolle in nicht zugelassenen Bereichen übernimmt oder schlicht im Fall von Missbrauch. Das eindrückliche Bild von „Skynet“, wie es jegliches Leben auf der Erde auslöscht oder Pensionsfonds nicht ordnungsgemäß verwaltet und alle Datensätze löscht, ist beunruhigend genug, um uns über Bedrohungen nachdenken zu lassen, die viel weiter in der Zukunft liegen. Die alte Weisheit „Vorbeugung ist die beste Medizin“ sollte auch in diesem Zusammenhang als absolut zutreffend und essentiell angesehen werden.


Wo ist das Geld in diesem Bild zu finden?

KPMG schwebt eine „unsichtbare Bank“ für das Jahr 2030 vor:

„… Es gibt keine Banking-App. Der Zugang zu Geld ist eng mit Gesundheit, Zeitmanagement, Freizeit und Freundschaft verwoben. Der Besuch einer Bank wird genauso fremdartig sein wie die Vorstellung, über das Festnetz zu telefonieren. Banken werden genauso unsichtbar, jedoch auch genauso wichtig sein, wie es die Hersteller von 4G-Basisstationen heute sind.“

Die Vision von KPMG für das Privatkundengeschäft von Banken im Jahr 2030 umfasst eine in drei verschiedene Komponenten aufgegliederte Branche: Die erste Ebene, im Beispiel von KPMG dargestellt durch universelle persönliche Assistenten wie EVA, ist die Plattform-Ebene. Hinzu kommen die Produkt- und die Prozessebene. Damit stellt sich die Bankenbranche auf eine Periode bedeutender Strukturreformen ein. Derzeit finden Verbesserungen des Kundenerlebnisses nur schrittweise statt, zum Beispiel kontaktlose Bezahlung, schnellere Onboarding-Prozesse etc. Wahre, transformative Innovationen sind hingegen eher selten.

„Kunden nutzen jedoch zunehmend andere Kanäle für Funktionen, die zuvor von Banken dominiert wurden. Die Einführung von Diensten wie Apple Pay – für den sich die meisten Banken registriert haben – lässt eine Zukunft erahnen, in der sich Finanzunternehmen hinter Geräten verbergen … Bankunternehmen bleiben weiterhin sehr vertrauenswürdig. Sie könnten Lifestyle-Ebenen entwickeln, um auf der Plattform-Ebene konkurrenzfähig zu bleiben. Das ist ein mögliches Szenario …“

Andere Szenarien hängen von der Entwicklung von Smartphones und anderen persönlichen Mobilgeräten sowie deren ständig verfügbaren Voice User Interfaces ab. Diese ermöglichen den Zugriff auf die wichtigsten Bankdienstleistungen. Dabei übertreffen Roboter und persönliche Assistenten die Möglichkeiten menschlicher Fähigkeiten in Bezug auf Geschwindigkeit und Datenmenge, die sie verarbeiten können.

Kommentare
Einen Kommentar schreiben
Entschuldigung

Ihr Browser ist leider nicht aktuell genug.
Um diese Webseite zu benutzen, benötigen Sie einen aktuellen Browser
Wir empfehlen einen der folgenden Browser in der aktuellsten Version zu installieren.

Auf iOS Geräten sollte mindestens die Betriebssystem Version iOS 9 installiert sein.

Mozilla Firefox Google Chrome Microsoft Edge Internet Explorer