Generative Adversarial Networks

Generative Adversarial Networks (GANs) sind eine Art von KI-Architektur, die aus zwei konkurrierenden neuronalen Netzen besteht: einem Generator, der neue Daten erstellt, und einem Diskriminator, der ...

Generative Adversarial Networks, kurz GANs, sind eine Architektur des maschinellen Lernens, bei der zwei neuronale Netze gegeneinander antreten. Das eine Netz, der Generator, erzeugt neue Daten – etwa Bilder, Texte oder Audiodateien. Das andere, der Diskriminator, bewertet, ob die vorgelegten Daten echt oder kuenstlich erzeugt sind. Aus diesem Wettstreit ergibt sich der Name: "adversarial" bedeutet so viel wie "gegnerisch".

Das Trainingsprinzip aehnelt einem Katz-und-Maus-Spiel. Der Generator versucht, immer ueberzeugendere Faelschungen zu produzieren, waehrend der Diskriminator immer besser darin wird, diese zu entlarven. Beide Netze verbessern sich dadurch wechselseitig, bis der Generator Ergebnisse liefert, die kaum noch von echten Daten zu unterscheiden sind. Vorgestellt wurde das Konzept 2014 von Ian Goodfellow. Seitdem haben GANs zahlreiche Anwendungen hervorgebracht, etwa die Erzeugung fotorealistischer Gesichter, das Hochskalieren von Bildern, das Umwandeln von Skizzen in fertige Grafiken oder das Erzeugen synthetischer Trainingsdaten fuer andere KI-Systeme.

Fuer den Mittelstand sind GANs vor allem indirekt relevant, weil sie hinter vielen Werkzeugen stecken, die im Arbeitsalltag auftauchen. Wer Produktbilder retuschiert, fehlende Bildbereiche ergaenzt, alte Fotos restauriert oder fuer Marketingzwecke kuenstliche Modelle und Szenen erzeugt, nutzt haeufig Software, die auf GAN-Technik aufbaut. Auch in der Mode- und Moebelbranche kommen GANs zum Einsatz, etwa um Varianten von Designs zu visualisieren, bevor sie produziert werden. Im industriellen Umfeld lassen sich mit GANs synthetische Bilddaten erzeugen, um Qualitaetskontrollen zu trainieren, wenn echte Fehlerbilder selten sind. Ein weiterer Bereich ist die Erkennung von Deepfakes: Wer sich gegen Identitaetsbetrug oder manipulierte Medien schuetzen will, sollte wissen, dass GANs die technische Grundlage solcher Faelschungen bilden.

In der oeffentlichen Wahrnehmung sind GANs inzwischen teilweise von Diffusionsmodellen verdraengt worden, die bei der Bilderzeugung qualitativ haeufig ueberlegen sind. GANs bleiben jedoch dort stark, wo schnelle Generierung, kleine Datensaetze oder spezialisierte Aufgaben gefragt sind.

Verwandte Begriffe