Wenn Maschinen Neues lernen

von Ingo Steinhaus

Künstliche Intelligenz, Deep Learning, Neuronale Netze - diese drei Stichworte haben in den letzten Jahren für intensive Diskussionen gesorgt. Es gab einige spektakuläre Durchbrüche in der Anwendung von Algorithmen mit künstlicher Intelligenz. So ist es beispielsweise Google gelungen, mit einem neuronalen Netzwerk einen Meister im Strategiespiel Go zu schlagen. Bisher galt das als unmöglich, da Go deutlich komplexer ist als etwa Schach.

Auch Facebook ist in diesem Bereich aktiv und nutzt KI-Verfahren für die Klassifizierung von Fotografien. Es erzeugt damit automatische Bildbeschreibungen und Indexstichworte. Das funktioniert inzwischen sehr gut, so auch bei dem Berliner Startup EyeEm. Neugierige können auf seiner Website einen automatischen Bildbeschreiber ausprobieren. Er erkennt Fotos erstaunlich häufig und kennzeichnet sie korrekt.

Machine Learning für Betrugserkennung und Kaufempfehlungen

Es gibt immer mehr Unternehmen, die KI-Verfahren bereits jetzt produktiv einsetzen, in erster Linie im Bereich des sogenannten maschinellen Lernens. Es wird oft auch mit dem englischen Fachbegriff "Machine Learning" (ML) bezeichnet und ist ein Oberbegriff für die künstliche Erzeugung von Wissen, bei dem ein technisches System aus Beispielen lernt und diese verallgemeinern kann.

Schon seit geraumer Zeit werden Machine Learning Verfahren in Spam-Filtern eingesetzt. Im Prinzip funktionieren sie dort auf die folgende Weise: Sie werden mit möglichst vielen Beispielen für Spam-Mails gefüttert. Aus denen leiten sie Merkmale ab und klassifizieren eintreffende E-Mails automatisch. Durch manuelle Kennzeichnung der E-Mails mit dem Attribut "Spam" oder "kein Spam" kann der Filter korrigiert werden, sodass er unerwünschte Werbung immer besser erkennt.

Es gibt Dutzende unterschiedlicher Verfahren für das maschinelle Lernen und einige schon klassische Anwendungsgebiete. So beginnen Versicherungen und Banken damit bereits seit kurzer Zeit die Betrugserkennung zu automatisieren. Auch Empfehlungsalgorithmen vieler Online-Händler basieren auf maschinellem Lernen. Der große Hype der letzten Jahre bezieht sich allerdings in erster Linie auf das sogenannte "Deep Learning", das mit künstlichen neuronalen Netzen verwirklicht wird.

Neuronetze sind in Analogie zum menschlichen Gehirn aus mehreren Schichten von untereinander vernetzten, per Software simulierten Neuronen aufgebaut. Da sich das maschinelle Lernen in diesem Fall auf die Tiefenstruktur eines Netzes richtet, hat sich der Name "Deep Learning" dafür eingebürgert. Die Neuronetze werden bereits seit den 1950er Jahren als Basis für künstliche Intelligenz diskutiert. Doch bis vor kurzem ist ein praktischer Einsatz immer an zu geringer Rechenleistung gescheitert. Erst seit etwa 2010 gibt es ausreichend leistungsfähige Prozessoren und IT-Architekturen.

Deep Learning erfordert enorme Datenmengen

Vor allem Bild- und Spracherkennung sowie automatische Übersetzungen basieren auf Deep Learning. Doch trotz der enormen Fortschritte der letzten Zeit sind diese Verfahren immer noch recht umständlich. Menschen erkennen Muster unter Umständen bereits anhand eines einzigen Beispiels und können das Erkannte schnell in Regeln gießen. Bei Machine Learning ist das nicht der Fall, für das Training eines Neuronetzes sind viele Daten erforderlich.

Ein Verfahren, das zum Beispiel bei der automatischen Übersetzung aber auch bei der Bilderkennung genutzt wird, ist das sogenannte "Supervised Learning". Dabei wird das Neuronetz mit Daten trainiert, die bereits die zu erkennenden Zielwerte enthalten. Am deutlichsten ist das bei Übersetzungen: Das Neuronetz lernt anhand von Sätzen in der Ausgangssprache Deutsch und der korrekten Übersetzung jedes Satzes in die Zielsprache, etwa Englisch.

Die bekannteste KI-Lösung für Übersetzungen ist der Google Translator. Für sein Training hat Google enorme Datenmengen eingesetzt, nämlich die im Internet frei verfügbaren Dokumente der Europäischen Union. Sie sind mehrsprachig, sodass recht einfach Übersetzungspaare gebildet werden können. Damit der Translator funktioniert, musste Google einige Millionen dieser Paare in die Anwendung einspeisen.

Auf ähnliche Weise werden Neuronetze für die Bilderkennung trainiert, nämlich anhand von bereits mit Schlagworten versehenen Bilddatenbanken. Dieses "Supervised Learning" kann erfolgreich in allen Bereichen eingesetzt werden, in denen es darum geht, Daten in Kategorien einzusortieren. Ein Beispiel aus der Bilderkennung: Hunde können unterschiedlich aussehen, werden aber von Menschen problemlos identifiziert. Nach dem Training mit einer sehr großen Datenmenge sind auch Neuronetze dazu in der Lage.

ML-Anwendungen können auch falsch trainiert werden

Durch die Art und Menge der Trainingsdaten entsteht allerdings die Gefahr der Überspezialisierung. Es ist möglich, die Algorithmen durch die Art der Trainingsdaten an eine zu spezielle Situation anzupassen. Die Eingabe von unbekannten Daten führt dann unter Umständen dazu, dass sie plötzlich nicht mehr funktionieren. Ein Beispiel wäre ein neuronales Netz, das nur anhand von Hunden mit spitzen Ohren trainiert worden ist. Es würde Hunde mit Schlappohren nicht so ohne weiteres erkennen.

Die Überspezialisierung kann die Ergebnisse von KI-Algorithmen stark beeinflussen. Ein Beispiel war der Versuch, einen Schönheitswettbewerb von einem entsprechend trainierten Neuronetz entscheiden zu lassen. Da es allerdings anhand einer Bilddatenbank mit vorwiegend Hellhäutigen trainiert wurde, wurden Dunkelhäutige gar nicht erst in Erwägung für den Wettbewerb gezogen. Der eigentliche Fehler ist auch hier wie so oft vom Menschen gemacht worden, nämlich durch die Auswahl einer ungeeigneten Bilddatenbank für das Training.

Leider lassen sich nicht alle Probleme mit neuronalen Netzen so leicht aufdecken, denn sie sind eine Art Blackbox. Sie treffen Entscheidungen, die nicht so ohne weiteres nachvollziehbar sind. Bei regelbasierten Algorithmen ist es relativ einfach, den Ablauf nachzuvollziehen - sie folgen einfach den vorgegebenen Regeln. Bei einem neuronalen Netzwerk ist das nicht mehr so leicht, da es gewissermaßen eigene Regeln aus den Daten ableitet.

Das Blackbox-Problem kann unter Umständen zum Hindernis werden, etwa wenn die Ergebnisse einer KI-Bonitätsbewertung vor Gericht angefochten werden. An solchen Überlegungen ist zu erkennen, dass Anwendungen des Machine Learning nicht ohne genaues Konzept eingeführt werden sollten. Zwar gibt es bereits Lösungen im Markt, doch wer jetzt Machine Learning nutzt, ist in den meisten Anwendungsfällen ein Early Adopter.

----------------------------------------------------------------

INFORM setzt ebenfalls auf Machine-Learning, z.B. zur Betrugserkennung oder auch für verbesserte Absatzprognosen für Lebensmittel. Mehr dazu finden Sie hier.



Diese Beiträge könnten Sie auch interessieren

Eine eiserne Fusion und ihre Auswirkungen auf die Lieferketten

Lesen

Herausforderung Sporaden - Wie sich auch schwer prognostizierbare Artikel vorausschauend planen lassen

Lesen

Eine gute Inventur ist (rotes) Gold wert

Lesen

Über den Autor

  • Ingo Steinhaus

    Ingo Steinhaus arbeitet seit 1991 als Freier IT-Journalist. Er ist Autor zahlreicher Computerbücher und veröffentlicht in bekannten Fachzeitschriften. Sein Interesse gilt allen technischen und digitalen Themen, vor allem digitaler Transformation, Innovation und Entrepreneurship. Diesen Themen widmet er sich auch in seinem Blog "Digital Heartland"

    Alle Beiträge dieses Autors

    Mehr über diesen Autor unter:

Unsere Autoren

Finden Sie alle unsere Autoren auf einen Blick!

Alle Autoren

Nach oben