Aktuelles & Informatives

Interessante Themen und Neuigkeiten - einfach und verständlich.
Freitag, 09 Juni 2023

Welche Methoden gibt es beim Machine Learning

Maschinelles Lernen (ML) ist eine Form der künstlichen Intelligenz (KI), die Daten verwendet, um einen Computer für die Ausführung von Aufgaben zu trainieren.

Welche Methoden gibt es beim Machine Learning

Im Gegensatz zur traditionellen Programmierung, bei der Regeln explizit programmiert werden, werden beim maschinellen Lernen Algorithmen verwendet, um automatisch Regelsätze zu erstellen. Auf einer hohen Ebene ist maschinelles Lernen eine Sammlung von Techniken, die aus vielen Disziplinen wie Statistik, Wahrscheinlichkeitstheorie und Neurowissenschaften stammen und mit neuen Ideen kombiniert werden, um durch Daten und Berechnungen Erkenntnisse zu gewinnen. Maschinelles Lernen wird weiter in Unterkategorien unterteilt, je nachdem, wie die Lernenden trainiert werden und welche Aufgaben sie bearbeiten.

Überwachtes Lernen / Supervised Learning

Überwachtes Lernen ist eine Art des maschinellen Lernens, bei dem ein Trainingssignal in Form von Kennzeichnungen verwendet wird, die häufig von einem menschlichen Experten festgelegt werden. Labels sind die gewünschte Ausgabe eines Lerners angesichts des ihm vorgelegten Beispiels. Aus diesem Grund kann man das überwachte Lernen auch als Lernen am Beispiel bezeichnen. Es gibt zwei Arten des überwachten Lernens, die in Rubix ML berücksichtigt werden.

Klassifizierung / Classification

Bei Klassifizierungsproblemen wird ein Lerner darauf trainiert, Proben aus einer Menge von k möglichen diskreten Klassen zu unterscheiden. Bei dieser Art von Problem sind die Trainingsmarken die Klassen, zu denen jede Probe gehört. Beispiele für Klassenbezeichnungen sind Katze, Hund, Mensch oder jede andere kategorische Bezeichnung. Zu den Klassifizierungsproblemen gehören die Bilderkennung, die Stimmungsanalyse von Texten und die Klassifizierung von Irisblüten.

Regression

Bei der Regression handelt es sich um ein Lernproblem, das darauf abzielt, ein kontinuierlich bewertetes Ergebnis vorherzusagen. In diesem Fall handelt es sich bei den Trainingsmarkern um kontinuierliche Datentypen wie Ganzzahlen und Gleitkommazahlen. Zu den Regressionsproblemen gehören die Schätzung von Hauspreisen, die Kreditwürdigkeitsprüfung und der Lenkwinkel eines autonomen Fahrzeugs.

Unüberwachtes Lernen / Unsupervised Learning

Eine Form des Lernens, die keine markierten Daten erfordert, wird als unüberwachtes Lernen bezeichnet. Unüberwachtes Lernen konzentriert sich auf die Erkennung von Mustern innerhalb der Stichproben. In Rubix ML gibt es drei Arten des unüberwachten Lernens.

Clustering

Beim Clustering wird einem Datensatz eine diskrete Clusternummer zugewiesen, die auf der Ähnlichkeit der Proben mit anderen Proben aus dem Trainingssatz basiert. Es kann als eine schwächere Form der Klassifizierung angesehen werden, bei der die Klassennamen unbekannt sind. Clustering wird z. B. verwendet, um Farben zu gruppieren, Kundendatenbanken zu segmentieren und Gemeinschaften in sozialen Netzwerken zu entdecken.

Erkennung von Anomalien

Anomalien sind definiert als Stichproben, die durch einen anderen Prozess als normal erzeugt wurden. Die Stichproben können entweder gekennzeichnet oder anhand ihres Anomalie-Scores eingestuft werden. Die Erkennung von Anomalien wird in der Informationssicherheit zur Erkennung von Eindringlingen und Dienstverweigerungen sowie in der Finanzbranche zur Aufdeckung von Betrug eingesetzt.

Vielfältiges Lernen / Manifold Learning

Manifold Learning ist eine Art von unüberwachter nichtlinearer Dimensionalitätsreduktion, die zur Einbettung von Datensätzen in dichte Merkmalsdarstellungen verwendet wird. Einbettungen können zur Visualisierung hochdimensionaler (4 oder mehr) Datensätze in niedrigen (1 bis 3) Dimensionen oder zur Komprimierung der Informationen innerhalb der Stichproben vor der Eingabe in einen Lernalgorithmus verwendet werden.

Deep Learning

Deep Learning ist ein Teilbereich des maschinellen Lernens, der Berechnungsebenen umfasst, die immer komplexere Merkmalsdarstellungen bilden. Es handelt sich um einen Paradigmenwechsel vom Feature-Engineering zur Konstruktion eigener Merkmale aus den Rohdaten durch den Lernenden. Deep Learning wird in der Bilderkennung, der Verarbeitung natürlicher Sprache (NLP) und für andere Aufgaben mit sehr hochdimensionalen Rohdaten eingesetzt.

AutoML

Automatisiertes maschinelles Lernen (AutoML) ist die Anwendung von automatisierten Werkzeugen beim Entwurf von Modellen für maschinelles Lernen. Das Ziel von AutoML ist es, den Lebenszyklus des maschinellen Lernens für Nicht-Experten zu vereinfachen und ein schnelles Prototyping zu ermöglichen. Darüber hinaus kann AutoML dabei helfen, einfachere und genauere Lösungen zu finden, als dies allein durch menschliche Intuition möglich wäre. Rubix bietet eine Reihe von Tools zur Automatisierung des maschinellen Lernprozesses, darunter Hyperparameter-Optimierer und Feature-Selektoren.

Verstärkungslernen / Reinforcement Learning

Reinforcement Learning (RL) ist eine Art des maschinellen Lernens, das darauf abzielt, die optimale Steuerung eines Agenten innerhalb einer Umgebung durch kumulative Belohnung zu erlernen. Die Daten, die zum Trainieren eines RL-Lerners verwendet werden, sind die Zustände, die durch Ausführen einer Aktion und anschließendes Beobachten der Reaktion erhalten werden. Überwachtes Lernen ist Lernen am Beispiel, Verstärkungslernen ist Lernen aus Fehlern. Verstärkungslernen wird verwendet, um KI für Spiele wie Go, Schach und Starcraft 2 zu trainieren, und in der Robotik für die Bewegungsplanung.

Sequence Learning

Sequence Learning ist eine Art von ML, die darauf abzielt, den nächsten Wert in einer Sequenz vorherzusagen, z. B. das nächste Wort in einem Satz oder einen zukünftigen Aktienkurs. Es unterscheidet sich vom Lernen aus Datensätzen dadurch, dass die Reihenfolge der Stichproben eine Rolle spielt. Die Zeitreihenanalyse ist ein Spezialfall des Sequenzlernens, bei dem die Sequenzen nach der Zeit geordnet sind. Sequenz-zu-Sequenz-Lernen wird verwendet, wenn die Ausgabe nicht nur der nächste Wert ist, sondern die nächste Folge von Werten.

Selbstüberwachtes Lernen / Self-supervised Learning

Ein hybrider Lernansatz ist das selbstüberwachte Lernen, bei dem ein Lerner darauf trainiert wird, die Teile einer Stichprobe vorherzusagen, die während des Trainings teilweise ausgelassen wurden. So können überwachte Methoden auf unmarkierte Daten angewendet werden, um Repräsentationen zu lernen. Selbstüberwachtes Lernen wird in Sprachmodellen wie GPT-3/4 zur Generierung von Textsequenzen oder in autonomen Robotern zum Lernen aus zusätzlichen Sensorrückmeldungen eingesetzt.