Machine Learning
Du möchtest wissen, was Machine Learning eigentlich ist und wie es funktioniert? Hier und im Video erfährst du es!
Inhaltsübersicht
Was ist Machine Learning?
Machine Learning ist ein wichtiger Bestandteil der künstlichen Intelligenz. Dabei kann ein IT-System auf Basis von Algorithmen in Daten selbstständig Muster und Gesetzmäßigkeiten erkennen. So kann maschinelles Lernen mithilfe von Daten Vorhersagen treffen. Außerdem kann es durch Erfahrungen lernen, eigenständig neue Probleme zu lösen.
Anwendungsbeispiele für Machine Learning findest du viele:
-
Personalisierung im Marketing: Machine Learning erkennt die Vorlieben und das Kaufverhalten von Kunden und kann so passende Produktempfehlungen liefern.
-
Autonomes Fahren: Das Fahrzeug nimmt verschiedene Sensordaten aus dem Straßenverkehr auf und lernt, darauf passend zu reagieren.
- IT-Security: Machine Learning Modelle können mithilfe umfangreicher Datenanalysen schon früh Unregelmäßigkeiten erkennen. So wird betrügerisches Verhalten (z. B. bei Kreditkartenbetrug) schnell unterbunden.
Wie funktioniert Machine Learning?
Damit Machine Learning Modelle richtig funktionieren, müssen sie zunächst von einem Data Scientist oder Data Analyst trainiert werden.
Dazu braucht es zuerst einen vorbereiteten Datensatz als Eingabe, mit dem das Machine Learning Modell trainieren kann. Soll das Modell beispielsweise Bilder von Tieren unterscheiden können, könnte der Datensatz eine Reihe von beschrifteten Tierbildern sein.
Anschließend durchsucht ein Machine Learning Algorithmus den Datensatz nach Mustern und Zusammenhängen. In Bezug auf die Tierbilder könnte das sehr vereinfacht so aussehen: sehr klein + grau + 4 Beine und Schwanz → Maus.
Nach einem erfolgreich abgeschlossenen Lernprozess erhältst du als Ausgabe ein Modell. Dieses wird benutzt, um neue und unbekannte Daten auszuwerten. In dem Bilderbeispiel muss das Modell also Tiere auf Bildern richtig klassifizieren, die es zuvor noch nicht gesehen hat.
Ist das Modell hier weniger erfolgreich als erwünscht, muss es nochmal trainiert werden, um besser zu werden.
Arten von Machine Learning Algorithmen
Es gibt 4 verschiedene Arten von Machine Learning Algorithmen:
- Überwachtes Lernen
- Unüberwachtes Lernen
- Teilüberwachtes Lernen
- Verstärkendes Lernen
Sie eignen sich jeweils für unterschiedliche Anwendungsbereiche:
Hier findest du die einzelnen Arten von Machine Learning Algorithmen zusammengefasst.
Überwachtes Lernen
Das Besondere beim überwachten Lernen (engl.: Supervised Machine Learning) ist, dass der Trainingsdatensatz schon mit dem richtigen Ergebnis versehen ist (z. B. ist ein Bild von einer Katze mit „Katze“ beschriftet). Das Modell versucht zuerst selbstständig, das Ergebnis vorherzusagen. Anschließend kann es seine Vermutung mit dem hinterlegten, richtigen Ergebnis vergleichen.
Dabei unterscheidest du zwei Arten:
-
Klassifikation: Hier sind verschiedene Ergebnisgruppen (Klassen) vorgegeben. Das Modell muss sich aus mehreren Möglichkeiten für die richtige entscheiden.
Beispiel: Das Tier ist ein Hund / Pferd / Fisch, Der Kunde kauft / kauft nicht
-
Regression: Hier ist die Ausgabe numerisch. Das Modell berechnet also eine Zahl und vergleicht diese dann mit dem richtigen Ergebnis.
Beispiel: Gewicht des Tieres in Kilogramm, Einkauf des Kunden in Euro
Anwendungsbeispiele für überwachtes Lernen sind:
Klassifikation:
- Objekterkennung
- Texterkennung
Regression:
- Umsatzvorhersage / Nachfrageprognose
- Wettervorhersagen
- Stromverbrauchsprognose
Unüberwachtes Lernen
Das unüberwachte Lernen (engl.: Unsupervised Machine Learning) ist das Gegenteil des überwachten Lernens. Denn hier gibt es keinen bekannten oder beschrifteten Trainingsdatensatz (z. B. nur verschiedene Tierbilder, ohne Beschriftung). Stattdessen erkennt der Algorithmus eigenständig versteckte Zusammenhänge und Muster. Auch hier unterscheidet man zwei Arten:
-
Clustering: Daten mit ähnlichen Eigenschaften werden in Cluster (Gruppen) eingeteilt.
Beispiel: Das Modell ordnet ähnliche Tiere zusammen an (z. B. alle Fische). Es kann die Tiere aber nicht benennen!
-
Association: Das Modell identifiziert Regeln und Zusammenhänge in den Daten.
Beispiel: „Wer Produkt A kauft, kauft auch Produkt B“
Beispiele für Anwendungsbereiche von unüberwachtem Lernen:
Clustering:
- Kundensegmentierung (Kunden mit gleichen Interessen in Gruppen einteilen)
- Marktsegmentierung
Association:
- Strukturen erkennen
- Empfehlungen weiterer Produkte in Online-Shops
Teilüberwachtes Lernen
Teilüberwachtes Lernen (engl.: Semi-supervised Machine Learning) ist — wie der Name schon sagt — eine Mischung aus überwachtem und unüberwachtem Lernen. Das Modell nutzt also sowohl bekannte als auch unbekannte Beispieldaten.
Die Einsatzgebiete des teilüberwachten Lernens sind im Grunde die Gleichen wie beim überwachten Lernen.
Der Unterschied liegt lediglich darin, dass hier nur eine geringe Menge an Daten mit bekanntem Ergebnis benötigt wird. Der Rest ist eine große Menge von Daten ohne bekanntes Ergebnis. Das ist ein immenser Vorteil, denn das Beschaffen von Beispieldaten mit dem jeweiligen Ergebnis ist meistens sehr zeit- und kostspielig. (z. B. das manuelle Beschriften von Bildern mit der passenden Tierart)
Deshalb ist das teilüberwachte Lernen der effizienteste Algorithmus für die Bildererkennung. Hier benötigt das Modell nur einen kleinen Datensatz an gelabelten Bildern. Das Modell wird zunächst mit diesem Datensatz auf die Klassifikation trainiert und wendet sein Wissen dann auf die unklassifizierten Bilder an. Hier erkennt es die Ähnlichkeiten und ordnet die unbekannten Bilder den klassifizierten Bildern zu. So sind die Bilder geordnet und das Modell kann die Tiere auch einfach benennen!
Schau dir jetzt noch eine etwas andere Art des maschinellen Lernens an.
Verstärkendes Lernen
Beim verstärkenden Lernen (engl.: Reinforcement Learning) geht es darum, dass ein Agent, zum Beispiel ein Roboter, mit seiner Umgebung interagiert und durch Feedback lernt, optimal zu handeln. Hier werden also gar keine Beispieldaten benötigt! Stattdessen handelt es sich um eine Art des Lernens, die nur von Ausprobieren und Belohnung/Bestrafung geprägt ist. Deshalb wird diese Methode insbesondere dann eingesetzt, wenn ein bestimmtes Ziel bekannt ist, aber nicht der Lösungsweg.
Schau dir dazu gleich mal ein Beispiel an:
Ein kleiner Roboter (Agent) soll lernen, wie viel er die Blumen im Garten (Umgebung) gießen muss, damit sie optimal wachsen. Dazu gießt er die Blumen zunächst mit einer willkürlichen Menge an Wasser (Aktion). Später nimmt er eine Probe und überprüft die Nährstoffe in der Pflanze (Observation). Aufgrund der Ergebnisse der Probe wird er entweder belohnt (die Pflanze wächst) oder bestraft (die Pflanze welkt). Dementsprechend verringert oder erhöht er die Wassermenge, bis er die optimale Menge für die Blume findet.
Passende Anwendungsbereiche für das verstärkende Lernen sind:
- Autonomes Fahren
- Verkehrssteuerung
- Spiel-KI
Machine Learning vs. Deep Learning
In Bezug auf künstliche Intelligenz werden oft die Begriffe Machine Learning und Deep Learning genannt. Aber was ist eigentlich der Unterschied zwischen der Definition von Machine Learning und Deep Learning?
Grundsätzlich ist Deep Learning ein Teilbereich des maschinellen Lernens. Das bedeutet, dass Deep Learning auch immer gleichzeitig Machine Learning ist.
Deep Learning ist aber nur der Bereich des maschinellen Lernens, der sich auf das Verwenden von neuronalen Netzen spezialisiert. Damit besitzt Deep Learning die Fähigkeit, auch unstrukturierte Daten zu verarbeiten. Denn die neuronalen Netze sind in der Lage, unstrukturierte Informationen wie Texte, Töne, Bilder oder Videos selbstständig in Zahlen umzuwandeln.
Beim „klassischen“ Machine Learning ist das nicht möglich. Hier müssen Menschen die Merkmale der Daten noch selbstständig extrahieren.
Neuronale Netze
Aber was sind Neuronale Netze eigentlich genau? Und wie funktionieren sie? Das alles erfährst du in unserem Video dazu!