NLG-Technologien: künstliche Intelligenz vs. regelbasierter Ansatz

von David Llorente

Nach dem derzeitigen Stand der Technik im Bereich Textgenerierung (natürlichsprachliche Generierung, englisch: Natural Language Generation, NLG) lassen sich zwei Hauptansätze finden. Das erste und am weitesten entwickelte Verfahren beruht auf einer Reihe von Regeln zur Umwandlung von Daten in Texte durch Anwendung von Geschäftsregeln und sprachlichen Regeln. Das zweite Verfahren (verwendet von Narrativa) beruht auf dem Einsatz künstlicher Intelligenz (KI). Systeme künstlicher Intelligenz sind Lernsysteme, die in der Lage sind, von komplexen Datensätzen und beispielhaften Ausgabetexten zu lernen.

Um die Unterschiede zwischen dem regelbasierten Ansatz und dem KI-Verfahren zu verstehen, können wir folgende Analogie verwenden: Ein regelbasierter Ansatz ist wie eine Autorennbahn, bei der die Autos nur mithilfe der vordefinierten Schlitze in der Spur fahren können. Das KI-Verfahren hingegen ist wie ein selbstfahrendes Auto von Tesla oder Google, bei dem das Auto selbständig Entscheidungen treffen sowie fast auf jeder Straße und jedem Gelände fahren kann.


Qualität der Texte

Es ist völlig richtig, dass ein System, bei dem genug Regeln kodifiziert wurden, gute Texte produzieren kann. Dies ist jedoch nicht das Problem. Das eigentliche Problem tritt auf, wenn der Themenbereich bzw. die Art des Textes zu komplex ist, um wirklich apriorisch wissen zu können, welche Regeln anzuwenden sind. Es ist relativ einfach, Regeln für Datensätze mit 10 oder 15 Datenpunkten zu erstellen. Das ist jedoch beim Einsatz von NLG-Technologien oftmals nicht der Fall. In der Regel haben NLG-Technologien mit Hunderttausenden von Datenpunkten zu tun. Gerade in diesen Fällen hat der Einsatz von KI einen klaren Vorteil.

Eines der häufigsten Anwendungsgebiete von NLG-Technologien ist heutzutage die Generierung von Zusammenfassungen europäischer Fußballspiele. Dieser Bereich mag relativ einfach erscheinen, doch Anbieter wie Optasports stellen mehr als 10.000 Datenpunkte pro Spiel zur Verfügung – und das ist nur ein Durchschnittswert. Regelbasierte Ansätze reichen für die Verwaltung und Analyse dieser Datensätze eindeutig nicht aus. Unternehmen, die einen solchen Ansatz verwenden, müssen daher die Anzahl an Datenpunkten verringern, um der Komplexität beizukommen. Dadurch entsteht eine Spielzusammenfassung, die nur die wichtigsten Ereignisse abdeckt, die Daten jedoch nicht analysieren oder Erkenntnisse gewinnen kann.


Skalierbarkeit und Suchmaschinenoptimierung (SEO)

Auch in puncto Skalierbarkeit liegen die Technologien künstlicher Intelligenz vorne. Beim Vergleich einer großen Anzahl an Texten, die mithilfe eines regelbasierten Ansatzes generiert wurden, finden sich sehr viele Satzwiederholungen. Auch die Struktur des Inhalts wiederholt sich ständig. Zudem enthalten die Texte sehr häufig irrelevante Informationen. Das ist ein großes Problem, wenn es um die Leistung bei der Suchmaschinenoptimierung geht. Suchmaschinen können diese Inhalte mit niedrigem Ranking bestrafen, da sie aufgrund von sich wiederholenden Inhalten als Texte geringer Qualität klassifiziert werden.

Im Gegensatz dazu kann KI weitaus vielfältigere Texten generieren – sowohl in Bezug auf die Struktur als auch die einzelnen Sätze.

Ein System künstlicher Intelligenz bestimmt die Textstruktur auf Basis der Daten und Erkenntnisse, die während des Schulungsprozesses erworben wurden. Das System entscheidet, was wichtig bzw. weniger relevant ist und strukturiert den Text dementsprechend. Das gleiche gilt auch auf der Satzebene: Das System entscheidet, wie man die Daten mithilfe natürlicher Sprache am besten beschreiben kann.


Textpflege

Texte bleiben nicht immer gleich, denn es besteht ein ständiger Bedarf an Aktualisierung und Verbesserung. Dabei gibt es viele mögliche Anwendungsfälle – wenn beispielsweise neue Datenpunkte (zum Beispiel Wetterinformationen zur Spielzusammenfassungen) hinzugefügt werden sollen oder der Blickwinkel geändert werden soll (zum Beispiel die Leistung bestimmter Kennzahlen in einem Marketing-Bericht hervorheben).

Bei der Anwendung eines regelbasierten Ansatzes ist die Festlegung, Analyse und Kodifizierung der neuen Geschäftsregel sowie deren Implementierung in das System erforderlich, was einen erheblichen Kosten- und Zeitaufwand darstellt.

Dagegen haben Systeme künstlicher Intelligenz einen eindeutigen Vorteil: Sie sind Lernsysteme und daher fällt der Aufwand für die Textpflege sehr gering aus. Für die Aktualisierung der Texte analysiert und gewichtet das System die neuen Daten automatisch und stellt sie dann entsprechend dar. Dazu benötigt das System künstlicher Intelligenz lediglich die neuen Datenpunkte und beispielhafte Ausgabetexte.


Umstellung vom regelbasierten Ansatz auf das KI-Verfahren

Im letzten Jahr konnte eine deutliche Änderung auf dem Markt beobachtet werden. Zwei Unternehmen für regelbasierte Textgenerierung (Automated Insights und Ax-Semantics) versuchen vom regelbasierten Ansatz auf das KI-Verfahren umzustellen – denn sie haben erkannt, dass ein regelbasierter Ansatz ihnen keinen technologischen Vorteil für die erfolgreiche Lösung komplexer Probleme bietet.

Durch den Vergleich von Autorennbahnen und selbstfahrenden Autos kann jeder den unglaublich hohen Aufwand nachvollziehen, den die Umstellung vom regelbasierten Ansatz auf das KI-Verfahren für Unternehmen mit sich bringt. Dabei geht es nicht um die Einstellung von Experten im Bereich KI, sondern vielmehr um die Änderung von Denkweisen, Herangehensweisen, Prozessen und sogar der Kultur eines Unternehmens in seiner Gesamtheit.

Kommentare
Einen Kommentar schreiben
Entschuldigung

Ihr Browser ist leider nicht aktuell genug.
Um diese Webseite zu benutzen, benötigen Sie einen aktuellen Browser
Wir empfehlen einen der folgenden Browser in der aktuellsten Version zu installieren.

Auf iOS Geräten sollte mindestens die Betriebssystem Version iOS 9 installiert sein.

Mozilla Firefox Google Chrome Microsoft Edge Internet Explorer