Was ist Deep Learning?
In immer mehr Bereichen begegnen uns Begriffe wie Machine Learning, Deep Learning oder auch Künstliche Intelligenz – was genau bedeutet das und wo werden diese Themen konkret angewendet?
In unserem Video „Wie lernen Maschinen? “ erklären wir die Grundlagen des maschinellen Lernens und verraten, wie Maschinen mit Hilfe von neuronalen Netzen intelligent werden. In diesem Artikel möchten wir noch einmal näher auf die einzelnen Teilbereiche eingehen und die verschiedenen Fachbegriffe erklären, die im Rahmen dieser Thematik immer wieder auftauchen: Deep Learning als Teilbereich des Maschinellen Lernens, was wiederum als ein Teilgebiet der sogenannten künstlichen Intelligenz gesehen wird.
1. Künstliche Intelligenz (KI)
In der Regel beschreibt KI die Nachahmung oder Nachbildung menschlicher Verhaltensstrukturen durch Maschinen, meist durch Computerprogramme. Der allgemeine Begriff KI umfasst mehrere Teilgebiete, wie zum Beispiel Expertensysteme, Systeme zur Musteranalyse oder Robotik. KI-basierte Systeme arbeiten mit unterschiedlichen Methoden, um menschliches Verhalten und Entscheidungsstrukturen nachzuahmen oder abzubilden, zum Beispiel mit statistischen Algorithmen, heuristischen Verfahren, künstlichen neuronalen Netzen (KNNs) oder anderen Varianten des Maschinellen Lernens.
2. Maschinelles Lernen
Maschinelles Lernen als Teilgebiet der KI umfasst automatisierte Verfahren, um aus einer Reihe von Beispieldaten allgemeine Regeln abzuleiten – es werden also Regeln aus den Beispieldaten „erlernt“. Dies kann durch Anwendung vorgegebener und nachvollziehbarer Algorithmen und Regeln geschehen, oder – wie im Fall von Deep Learning – mithilfe von künstlichen neuronalen Netzen. Maschinelles Lernen unterscheidet überwachtes und unüberwachtes Lernen. Bei überwachtem Lernen enthalten die Beispieldaten zum Anlernen sowohl die Eingaben als auch die dazugehörigen erwarteten Ergebnisse (zum Beispiel Klassifizierungen), während bei unüberwachtem Lernen das System aus den Eingaben selbst mögliche Ergebnisse identifizieren soll.
3. Deep Learning
Deep Learning ist eine Methode des maschinellen Lernens, die während des Lernvorgangs selbständig aus Beispieldaten allgemeine Regeln als künstliches neuronales Netz aufbaut (trainiert). Vor allem im Bereich des maschinellen Sehens wird das neuronale Netz dabei meist durch überwachtes Lernen trainiert, also mit Beispieldaten und vorgegebenen Ergebnissen zu den Beispieldaten.
Wie funktioniert Deep Learning?
1. Künstliches Neuronales Netz
Deep Learning als Methode verwendet eine bestimmte Form von künstlichen neuronalen Netzen (KNNs), die zunächst mit Beispieldaten trainiert werden müssen. Ein trainiertes KNN kann dann für seine Aufgaben eingesetzt werden. Der Einsatz eines trainierten KNN wird „Inferenz“ genannt. Während der Inferenz meldet das KNN zu zugeführten Daten gemäß den erlernten Regeln eine Einschätzung der Daten zurück. Dies kann zum Beispiel die Einschätzung sein, ob ein zugeführtes Bild ein fehlerhaftes oder fehlerfreies Objekt darstellt.
2. Neuronen, Schichten und Verbindungen
Ein KNN besteht aus Schichten von „Neuronen“ die miteinander verknüpft sind. Im einfachsten Fall sind das eine Eingabeschicht und eine Ausgabeschicht. Neuronen und Verknüpfungen kann man sich als Matrizen vorstellen. Eine Verknüpfungsmatrix beinhaltet für jeden Wert der Eingabematrix eine Verbindung zu den Werten der Ergebnismatrix. Die Werte der Verknüpfungsmatrix enthalten dabei die Gewichtung der jeweiligen Verbindung. Über die Gewichtung des Eingabewertes mit dem Wert der Verknüpfungsmatrix entsteht der jeweilige Wert auf der Ergebnismatrix.
3. Tiefes künstliches neuronales Netz
Der Begriff Deep Learning bezeichnet das Trainieren sogenannter „tiefer“ KNNs. Diese bestehen neben der Eingabe- und Ausgabeschicht noch aus Hunderten zusätzlichen „versteckten“ Schichten zwischen den sichtbaren Schichten für Ein- und Ausgabe. Die Ergebnismatrix einer versteckten Schicht dient dabei als Eingabematrix der nächsten Schicht. Erst die Ausgabematrix der letzten Schicht enthält in diesem Fall das Ergebnis.
4. Training
Beim Training des KNNs werden die Gewichte zunächst zufällig gesetzt. Dann werden nach und nach die Beispieldaten zugeführt. Über eine Lernregel werden dabei die Gewichte der Verknüpfungen entsprechend der Eingabedaten und des erwarteten Ergebnisses angepasst. Wie gut ein KNN letztendlich funktioniert, also die Präzision der Einschätzungen im Ergebnis, hängt stark von den Beispieldaten des Trainings ab. Eine hohe Anzahl an Beispieldaten mit einer hohen inhaltlichen Variabilität im Training führt in der Regel zu präziseren Ergebnissen in der Inferenz. Wird mit vielen sehr ähnlichen oder sich wiederholenden Daten trainiert, dann wird das KNN im Einsatz Daten nicht einschätzen können, wenn sich diese von den Beispieldaten unterscheiden. In so einem Fall spricht man von „overfitting“ eines KNNs.
Was kann ich mit Deep Learning machen?
Egal, ob Groß oder Klein – Kekse mögen wir wohl alle. Anhand des Keks-Beispiels möchten wir zeigen, wie Deep Learning funktioniert. Die Einsatzgebiete von Deep Learning sind vielfältig. Vor allem im Bereich des maschinellen Sehens ist Deep Learning eine weit verbreitete Methode für verschiedenste Aufgaben. Die wohl gängigsten Aufgaben für Deep Learning im visuellen Bereich sind Bildanalysen zur Klassifizierung und Segmentierung von Bilddaten.
1. Bildklassifizierung
Bei der Bildklassifizierung werden Bilder verschiedenen Klassen zugeordnet, zum Beispiel um fehlerhafte Bauteile von fehlerfreien Bauteilen zu trennen und nach verschiedenen Fehlerarten zu sortieren, oder um Urlaubsbilder verschiedenen Kategorien zuzuordnen. In der Keksproduktion würde hier etwa geprüft, ob alle Kekse heile sind oder ob es zu Brüchen gekommen ist.
2. Bildsegmentierung und Objekterkennung
Die Bildsegmentierung ordnet jedes Pixel eines Bildes einer Klasse zu. Dadurch lassen sich mehrere verschiedene Objekte auf einem Bild identifizieren, zum Beispiel, um verschiedene Obststücke in einem Einkaufskorb zu identifizieren oder um Schilder, Fahrwege und Personen im Straßenverkehr zu erkennen. Über Bildsegmentierung können wir zum Beispiel auch schauen, welche verschiedenen Keksformen über unser Fließband laufen – rund, quadratisch oder sechseckig.
3. Bildbearbeitung
Auch für die Bearbeitung und Optimierung von Bilddaten kann Deep Learning hilfreich sein, zum Beispiel, um störendes Rauschen aus Bildern zu entfernen, oder um von optischen Linsen verursachte Störungen auszugleichen.