Steuerung von KI: Worüber niemand spricht

Warum das Training von KI auf eigenen Daten so wichtig ist

von Karthik Balakrishnan, Wysdom.AI

Beim Herumspielen mit einem hochmodernen Parts-of-Speech-Tagger gelangte ich zu einer erschreckenden Erkenntnis: während derzeit alle die Gunst der Stunde nutzen, um ihre frisch gebackenen KI-Tools und Frameworks zu verkaufen, machen sich nur die wenigsten Menschen (wenn überhaupt jemand) darüber Gedanken, dass KI alles andere ist als DIY IKEA Möbel! Bevor ich diese Behauptung weiter ausführe, lassen Sie mich erklären, was passiert ist.

Sprache in ihrer unendlichen Schönheit ist unglaublich nuanciert. In dem Satz "my car has four seats" ist das Wort "seats" ein Substantiv. Jedoch im Satz "my car seats four" ist das Wort "seats" ein Verb. Beide Sätze sind in ihrer Bedeutung zwar identisch. Der scholastische Tagger nahm aber an, dass "seats" ein Substantiv sei und zwar unabhängig vom Satzbau!

Und wissen Sie was? "Parts-of-Speech"-Tagging verwendet maschinelles Lernen, um einen ungeordneten Satz in ein strukturiertes Gebilde umzuwandeln, wobei jedes Wort mit der entsprechenden grammatischen Rolle versehen wird, die es spielt. Es ist der kritischste Schritt in der NLU-Kette (Natural Language Understanding) – wenn man hierbei einen Fehler macht, bricht alles Nachfolgende zusammen!

Beispiel: Ergebnis eines Parts-of-Speech-Taggers

Beispiel: Ergebnis eines Parts-of-Speech-Taggers

Der Grammatik-Polizist in mir erkannte schnell das Risiko von vorgefertigten Blackbox AI-Tools:

  1. Man hat wenig Kontrolle darüber, wie diese Tools trainiert werden

    ● Obwohl die meisten kommerziellen kognitiven Dienste Wunder bewirkt haben, um die Einführung von Künstlicher Intelligenz in alltäglichen Anwendungen zu beschleunigen, gestatten sie einem nur selten oder überhaupt nicht (fast nie), dass man die Trainingsparameter des Modells verändert.

    ● Wer mit maschinellem Lernen vertraut ist, bemerkt schnell, dass das Training mit einem Naive Bayes vs. Max Entropy Algorithmus sehr unterschiedliche Modelle und Ergebnisse erzeugen kann.

  2. Man hat wenig Kontrolle darüber, wofür diese Tools trainiert werden

    ● Einige kognitive Dienste gestatten, dass man ihre Modelle mit eigenen Daten trainiert.

    ● Manche jedoch nicht! Ein großes Risiko bei der Verwendung von vortrainierten Modellen besteht darin, dass man keine Ahnung hat, auf welcher Datenbasis die Modelle trainiert wurden.


Nehmen wir ein Halloween-Beispiel. Mal angenommen, einer von 100 Menschen ist ein Zombie und das auf maschinellem Lernen basierende Modell soll die Zombies unter den Menschen ausfindig machen. Wenn man das Modell nun auf 99 Menschen und einen Zombie trainiert, wird das Modell mit sehr hoher Wahrscheinlichkeit einen Zombie als Menschen klassifizieren. Man hätte also genauso gut blind raten können!

Mein Verdacht ist, dass der Parts-of-Speech-Tagger einseitigen Daten ausgesetzt war, d. h. die Mehrheit der Stichproben hatte "seats" in einem Substantivkontext, was die Ausgabe des Modells verzerrte.

Wenn die Daten einseitig sind, kann das Modell selbst unbrauchbar werden.

Das bringt mich zu meinem früheren Punkt zurück. Die Bedienung von Künstlicher Intelligenz ist nicht "Plug and Play". Wer davon ausgeht, baut auf Sand! Bei der Steuerung von KI geht es darum, Ihre Daten zu besitzen und die richtigen Ressourcen zu haben, um Ihre Modelle ständig mit den richtigen Daten zu trainieren. Zu erkennen, was richtig ist, erfordert Erfahrung und Fachwissen und ist manchmal Kunst und nicht Wissenschaft.

Bei Wysdom.AI glauben wir an einen kognitiven Plattform-Ansatz: eine Einheit aus Wysdoms innovativen kognitiven Produkten, gezielt erweiterten DIY-kognitiven Diensten und der hohen Bedeutsamkeit von KI-Steuerung. Ein Plattform-Ansatz für KI ist unerlässlich, um Ihre Geschäftsprozesse wirklich zu verbessern und um sich positiv auf Ihre Kunden auszuwirken.

In den Jahren, die wir in der Branche sind, haben wir große und kleine Unternehmen gesehen, die gescheitert sind bzw. Erfolg hatten. Erfolg ist oft das Ergebnis sorgfältiger Planung und der Einführung eines Plattform-Ansatzes für KI.

Bevor Sie also überstürzt DIY-kognitive Dienste einsetzen, sollten Sie immer daran denken:

Wer sich beim KI-Training auf andere verlässt, ist oft verlassen.

 

Kommentare
Einen Kommentar schreiben
Entschuldigung

Ihr Browser ist leider nicht aktuell genug.
Um diese Webseite zu benutzen, benötigen Sie einen aktuellen Browser
Wir empfehlen einen der folgenden Browser in der aktuellsten Version zu installieren.

Auf iOS Geräten sollte mindestens die Betriebssystem Version iOS 9 installiert sein.

Mozilla Firefox Google Chrome Microsoft Edge Internet Explorer