Künstliche Intelligenz (KI) stattet Maschinen mit Fähigkeiten aus, die mit intelligentem, menschlichem Verhalten vergleichbar sind. Unter dem Oberbegriff KI werden Problemlösungsmethoden, darunter Logik und Planungsverfahren, für die menschliche Intelligenz erforderlich wäre, zusammengefasst. Die wohl bekannteste sowie meist beforschte und angewandte Methode ist dabei das Machine Learning.
Maschinelles Lernen oder Machine Learning (ML) befähigt Maschinen und Roboter, aus Erfahrung Wissen zu generieren, mit dem sie Probleme lösen können. Der Schlüssel dafür sind Daten, wobei der Ansatz der traditionellen Datenverarbeitung umgewandelt wird. Bisher war es nötig, ein Programm für einen Computer zu schreiben, das mithilfe von Eingabedaten Ausgaben erzeugt. Mithilfe von Machine Learning soll sich ein Computer nun selbst programmieren: Aus eingegebenen Trainingsdaten lernen Maschinen eigenständig Muster und Gesetzmäßigkeiten abzuleiten und schließlich sogar unbekannte Daten korrekt auszuwerten. Hierfür erhält er Eingabedaten, je nach Machine-Learning-Methode auch Ausgabedaten, und erstellt darauf basierend automatisch das erforderliche Programm. Für diese Art von Lernen gibt es wiederum verschiedene Verfahren, wobei Deep Learning das am häufigsten verwendete ist.
Deep Learning (DL) nutzt tiefe künstliche neuronale Netze, um Erkenntnisse aus Daten zu gewinnen. Die Arbeitsweise künstlicher neuronaler Netze orientiert sich an den Vorgängen im menschlichen Gehirn, wo jede Nervenzelle (Neuron) mit durchschnittlich 10 000 anderen Neuronen verbunden ist. Bei künstlichen neuronalen Netzen sind die Neuronen in Schichten angeordnet, Verbindungen liegen zwischen Neuronen der direkt aufeinanderfolgenden Schichten vor. Für ein gutes Training des Netzes muss es eine Vielzahl an Eingabedaten und zunächst die richtige Ausgabeinformation erhalten. Dabei wird ein Optimierungsproblem gelöst, bei welchem der Fehler zwischen den vorgegebenen Ausgabedaten und dem vom Netz generierten Ausgaben schrittweise reduziert wird. So trainiert es, die Muster der Daten nachzuvollziehen und später auch bei unbekannten Datensätzen auf das richtige Ergebnis zu kommen.
Reinforcement Learning (RL) ist eine Form des Maschinellen Lernens, wobei der RL Agent benutzt wird, um sequentielle Probleme zu lösen, die Entscheidungen erfordern. RL wird auf das Problemsetting angewendet, wenn die Qualität einzelner Aktionen nicht direkt beurteilt werden kann, sondern stattdessen das Ergebnis einer Serie von Aktivitäten. Die Aufgabe wird durch ein Rewardsignal repräsentiert.
Der RL Agent interagiert mit seiner Umgebung, erhält Rewardsignale von ihr und optimiert seine Entscheidung entsprechend, um sein Gesamtergebnis (die Summe der Rewardsignale) zu maximieren. Zum Beispiel kann der RL Agent genutzt werden, um einen Roboterarm zu steuern, damit er ein bewegtes Ziel erreicht. Das Rewardsignal kann der Abstand zwischen Roboterarm und Ziel sein.
Jüngste Durchbrüche konnten durch die Kombination von Deep Learning mit RL erzielt werden, wobei der RL Agent durch einen funktionalen Approximator (wie ein Neuronales Netz) repräsentiert wird. Deep RL wurde erfolgreich implementiert, um eine übermenschliche Leistung in Spielen wie Go, Atari usw. zu erzielen. Die Anwendung von Deep RL im industriellen Kontext ist jedoch sehr begrenzt.
Am Fraunhofer IPA fördern wir den Gebrauch von Deep RL in der Industrie. Einige Fälle, die wir zurzeit bearbeiten, umfassen: