Über die nutzerfreundliche Gestaltung von Conversational User Interfaces

Nutzerfreundliche Gestaltung von Conversational User Interfaces

"Hallo Computer, wir müssen reden."

Einer der Gründe, warum wir anfangen, mit Computern zu sprechen, ist einfach und naheliegend: Weil wir es können. Die technischen Möglichkeiten für Stimmerkennung und das Verständnis natürlicher Sprache haben sich in den letzten Jahren rasant entwickelt.

Ein weiterer wichtiger Faktor ist das Internet der Dinge (IoT), das unaufhaltsam wächst und immer mehr Geräte in unserer nächsten Umgebung einbezieht.

„Im Internet der Dinge werden Objekte intelligent und können über das Internet untereinander Informationen austauschen. Die virtuelle Welt wird mit der realen Welt vereint.“ [1]

IoT-fähige Geräte haben ihre eigene Identität und sind somit gewissermaßen eigene kleine Computer. Dies bedeutet aber nicht, dass man sie sich wie einen Desktop-Computer vorstellen kann mit Eingabe-Tastatur und Bildschirm. Viele von ihnen haben nicht einmal ein Display. Oft werden sie in einem Kontext genutzt, in dem eine Tastatur oder ein Bildschirm sinnlos oder gar unmöglich wäre, weil der User weder Hand noch Auge frei hat. Im Auto beispielsweise sollte sich der Fahrer besser auf die Straße konzentrieren, anstatt umständlich etwas einzutippen oder die Eingabe zu kontrollieren. Auch in der Küche gibt es genug Situationen, in denen man die Hände besser im Kuchenteig lässt, um nicht die Tastatur zu verschmieren oder das Flambieren im Auge behält, statt etwas nachzulesen. Manchmal ist es auch pure Bequemlichkeit: es ist schlicht einfacher, per Sprachbefehl den Fernsehkanal zu wechseln statt aufstehen zu müssen, weil der Hund mal wieder die Fernbedienung versteckt hat.


Volle (neue) Kontrolle


Für all die fortschrittlichen Geräte mit ihren neuen Möglichkeiten braucht es ein noch nie dagewesenes Interaktions-Paradigma, um sie zu kontrollieren. Gesten wären eine Möglichkeit – viel einfacher und effektiver hingegen ist es, die Stimme zu benutzen. Sie gehört zu den stärksten Interaktionsinstrumenten. Es ist erlernt und eingeübt, seit wir sprechen lernten: Wenn man etwas möchte, muss man es sagen. Es gibt zudem mehr Möglichkeiten, mit der Stimme etwas auszudrücken als mit Gesten. Für einen Sprachbefehl ist keine visuelle Verbindung nötig, er kann gegeben werden, während man andere Dinge tut.

Es gibt verschiedene Formen von Conversational User Interfaces. Nicht jede ist für jeden Einsatz geeignet, jede hat ihre Vor- und Nachteile. Ein Beispiel sind Sprach-Interfaces, wie man sie in Hardware wie dem Amazon Echo findet. Diese können auch in Service-Hotlines eingesetzt werden. Ein Nachteil ist, dass manche Menschen in der Öffentlichkeit Scheu haben, sie zu nutzen. Irgendwie scheint es noch seltsam, seinem Handy in Anwesenheit anderer Menschen zu befehlen: „Siri, speichere eine Notiz: Toilettenpapier, Bier und Magerquark.“ Themen, die die Intimsphäre berühren, mag man nicht öffentlich teilen. Viele haben auch Bedenken, wenn es um Datenschutz geht und man sich beispielsweise bei seiner Bank per Stimme identifizieren muss.

Außerdem ist die Menge der Informationen, die per Sprache ausgegeben werden können, begrenzt – es dauert schlicht zu lange, große Informationsmengen vorzulesen. Zudem gibt es keine sichtbare Unterstützung in Form von Bildern oder Grafiken. Dies ist in unserer visuell geprägten Gesellschaft ungewohnt.


Das Beste aus zwei Welten


Hier helfen Multi-Modale Userinterfaces wie Siri. Sie kombinieren das Beste aus zwei Welten: in den meisten Fällen kann man das Gerät zwar ohne die Hände bedienen, hat aber noch ein visuelles Ergebnis – hilfreich, wenn es um lange Listen oder komplexere Suchergebnisse geht. Diese multimodalen Helfer haben aber den Nachteil, dass sie meist noch eine App oder ähnliche Hardware-Software-Kombination benötigen, um zu funktionieren. Reine Chatbots sind hier deutlich flexibler.

Chatbots arbeiten mit natürlicher Sprache, ihr Gebrauch funktioniert intuitiv. Nachteil: der User muss sein Anliegen eintippen. Dies benötigt viel Zeit und Aufwand sowie seine volle Konzentration. Allerdings können sie leicht in jeden existierenden Kanal integriert werden. Vorhandene Kanäle wie Facebook oder Telegram reichen somit in der Regel aus, um den Kunden zu erreichen. Doch Vorsicht: Um wirklichen Nutzen zu erzielen – sowohl für Zielgruppe als auch fürs Unternehmen – sollte man sich die Dialoge genau anschauen. Wer seine normalen Business-Prozesse einfach in ein Chatformat überträgt, ist mit einem traditionellen User Interface vermutlich besser bedient.


Goldene Regeln


Um Conversational User Interfaces zu designen, sind agile Methoden hilfreich. Denn es geht um ständiges Versuchen, Testen und Verbessern. Man sollte nicht den Fehler begehen, das eigene Plauder-Verhalten als allgemeingültig anzusehen. Der User sollte hier wirklich im Zentrum stehen, denn eine Unterhaltung ist niemals ein gerader Pfad. Um den richtigen, den natürlichen Fluss zu finden, ist es notwendig, den User zu verstehen, um dann auf Grundlage der Ergebnisse die Usability zu verbessern.

Hier nun die glorreichen Sieben, die goldenen Regeln zum Erfolg:

  1. Plane genau, wann und wie du den User einbeziehen möchtest
  2. Dein Projekt muss so aufgesetzt sein, dass es iteratives Arbeiten ermöglicht
  3. Nutze Methoden wie Google Ventures Sprint, Agiles Arbeiten, Scrum, Design Thinking
  4. Nutze die richtigen Tools, um schnell Prototypen zu bauen und sie zu testen
  5. Prototypen, prototypen und nicht vergessen: prototypen!
  6. Teste frühzeitig und beziehe den User ein – er kann auch schon Teil des kreativen Entstehungsprozess sein
  7. Verbessere dein Produkt ständig und habe keine Angst vor „unfertigen“ Produkt-Releases (was vermutlich vor allem großen deutschen Unternehmen schwer fallen dürfte)



Lösungen erträumen: Design Thinking


Design Thinking ist eine probate Technik, um den richtigen Use Case auszuwählen. Mit dieser Methode findet man zu einem vertretbaren Aufwand so viel wie möglich über eine Idee, ein Produkt heraus. Den Zeitrahmen kann man dabei ganz nach Gusto setzen: Eine intensive Analyse, mit der man mehrere Wochen verbringt, ist ebenso möglich wie ein Prozess über eine Woche oder nur während eines einzigen Tages.

Zu Beginn steht die Definition: Welches Problem soll gelöst werden. Dann geht es ins Prototyping und Testing. Und wieder von vorne: Testing ist nicht das Ende, sondern der Beginn einer erneuten Verbesserung des Konzepts.


Ihre Reiseverbindung: Customer Journey Mapping


Macht es überhaupt Sinn, einen Chatbot zu bauen? Diese ketzerische Frage sollte man sich zu Beginn stellen. Einen Bot zu bauen, nur um einen Bot zu haben, ist meist nicht angebracht. Oft würde eine klassische App oder Website viel besser den beabsichtigten Zweck erfüllen. Eine Customer Journey Map ist eine gute Methode, um herauszufinden, ob und wenn ja an welcher Stelle ein Conversational Interface Sinn macht. Wer ist die Zielgruppe? An welcher Stelle ihrer Customer Journey erreicht man sie mit einem digitalen Assistenten am besten? Was sind ihre Painpoints, wo liegen ihre Probleme?

Wer seine Zielgruppe klar definiert und zum Beispiel mithilfe von Personas greifbar macht, kann die echten Herausforderungen und Probleme leichter bewältigen. Dabei sollte man niemals den Businessnutzen des zu gestaltenden Chatbots aus dem Blick verlieren. Denn einen digitalen Assistenten zu erschaffen, der kein Business-Problem des Unternehmens löst, ist wertlos.


Immer vor Ort: Place-onas


Ein wichtiger Punkt der Überlegungen sind der Ort und die Situation, in der der User das Interface benutzt. Bill Buxton kreierte in Anlehnung an Personas den Begriff „Place-onas“, um die spezifischen Bedürfnisse des Users deutlich zu machen. Bei einer Place-ona für das Thema Kochen würden schmutzige Hände die Nutzung eines Touchscreens verhindern; Augen, Ohren und Stimme hingegen können eingesetzt werden. In einer öffentlichen Bücherei wiederum kann der User Hände und Augen ohne Restriktionen benutzen, Ohren und Stimme einzubringen hingegen wäre hier tabu.


Was für eine Persönlichkeit!


Eine weitere wichtige Überlegung bei der Erschaffung eines digitalen Assistenten ist seine Persönlichkeit. Menschen erwarten eine Art Charakter von ihrem virtuellen Gegenüber. Dieser muss konsistent sein und den User führen: Beispielsweise soll der User die richtigen, angemessenen Fragen stellen und sich nicht provoziert fühlen. Die Persönlichkeit des Assistenten ist gleichsam ein Botschafter und muss daher den Markenwerten des Unternehmens entsprechen.


Pro Prototypen


Hat man all diese Überlegungen angestellt, ist es an der Zeit, Prototypen zu testen. Da es um Conversational Interfaces geht, machen Modelle auf Papier natürlich wenig Sinn. Ein Team-Mitglied kann in die Rolle der sprechenden künstlichen Intelligenz schlüpfen und so erste Reaktionen der User hervorrufen.

Und dann heißt es im Karussell der Iteration Runde um Runde zu drehen, um die Idee immer weiter zu verbessern. Denn man muss vor allem eines akzeptieren: Nach dem Testen ist vor dem Testen. Denn nur wer die iterative Idee wirklich lebt, wird Erfolg haben.


Finale, ohooo!


Und auch wenn der finale digitale Assistent released ist, empfiehlt es sich, ihn kontinuierlich weiterzuentwickeln, dabei stets den User im Mittelpunkt. Denn nicht der Bot wird am Markt überleben, der die originellsten Features hat, sondern derjenige, der die Bedürfnisse des Users am optimalsten erfüllt.

 

-----------------------------------------------------------------------------------------

Quellenangaben:

[1] Fraunhofer IML: FAQ zum Internet der Dinge, (abgerufen am 02.08.2017)

Kommentare
Einen Kommentar schreiben
Entschuldigung

Ihr Browser ist leider nicht aktuell genug.
Um diese Webseite zu benutzen, benötigen Sie einen aktuellen Browser
Wir empfehlen einen der folgenden Browser in der aktuellsten Version zu installieren.

Auf iOS Geräten sollte mindestens die Betriebssystem Version iOS 9 installiert sein.

Mozilla Firefox Google Chrome Microsoft Edge Internet Explorer