Deep Learning

Deep Learning ist ein Teilbereich des maschinellen Lernens, der auf künstlichen neuronalen Netzen mit mehreren Schichten basiert. Diese "tiefen" Netze können komplexe Muster in Daten erkennen und sind...

Deep Learning ist ein Teilbereich des maschinellen Lernens, der auf kuenstlichen neuronalen Netzen mit vielen aufeinanderfolgenden Schichten beruht. Der Begriff "tief" bezieht sich dabei auf genau diese Schichtenstruktur: Statt nur einer oder zwei Verarbeitungsebenen nutzen tiefe Netze oft Dutzende oder Hunderte, wodurch sie sehr komplexe Zusammenhaenge in grossen Datenmengen erkennen koennen.

Technisch betrachtet besteht ein tiefes neuronales Netz aus Schichten von kuenstlichen Neuronen, die jeweils einfache Rechenoperationen ausfuehren. Jede Schicht lernt eine andere Abstraktionsebene der Daten. Bei einem Bilderkennungsmodell erkennt die erste Schicht beispielsweise Kanten und Farbverlaeufe, mittlere Schichten setzen daraus Formen zusammen, und spaetere Schichten identifizieren ganze Objekte wie Gesichter oder Fahrzeuge. Trainiert werden diese Netze mit grossen Datenmengen und viel Rechenleistung, meist auf spezialisierten Grafikkarten. Bekannte Architekturen sind Convolutional Neural Networks fuer Bilder, Recurrent Neural Networks fuer Zeitreihen sowie Transformer-Modelle, auf denen heutige Sprachmodelle wie ChatGPT basieren.

Auch wenn die wenigsten kleinen Unternehmen selbst Deep-Learning-Modelle entwickeln, profitieren sie taeglich davon. Spracherkennung in Diktiergeraeten und Telefonanlagen, automatische Belegerkennung in der Buchhaltungssoftware, Texterstellung mit KI-Assistenten, Uebersetzungsdienste wie DeepL oder Bildersuche im Onlineshop beruhen alle auf Deep Learning. Wer eine Branchensoftware einkauft, die mit "KI-Funktionen" wirbt, kann davon ausgehen, dass im Hintergrund tiefe neuronale Netze arbeiten. Praktisch relevant wird der Begriff vor allem bei der Auswahl von Werkzeugen: Anbieter, die auf vortrainierte Deep-Learning-Modelle setzen, koennen oft sofort einsatzfaehige Loesungen liefern, ohne dass eigene Datenmengen aufgebaut werden muessen.

Die Staerken von Deep Learning liegen in der Verarbeitung unstrukturierter Daten wie Text, Bild und Ton. Grenzen zeigen sich beim Bedarf an Rechenleistung, bei der Nachvollziehbarkeit der Entscheidungen und beim Datenschutz, da viele Modelle in der Cloud betrieben werden. Verwandte Begriffe sind maschinelles Lernen, neuronale Netze und Foundation Models.

Verwandte Begriffe