YOLO (You Only Look Once)
Schnelle Objekterkennungsmethode, die Position und Klasse von Objekten in Bildern in Echtzeit erkennt, durch einen einzigen Vorwärtsdurchlauf des Netzwerks.
YOLO (You Only Look Once) ist eine Familie von Verfahren zur Objekterkennung in Bildern und Videos, die durch ihre Geschwindigkeit und Einfachheit zum Standard für Echtzeitanwendungen geworden ist. Der Name beschreibt das Kernprinzip: Das Bild wird nur einmal durch das neuronale Netz geschickt, das in einem einzigen Schritt sowohl die Position als auch die Klasse aller Objekte vorhersagt.
Klassische Objekterkennungsverfahren (etwa R-CNN) durchsuchen ein Bild in mehreren Schritten nach möglichen Regionen und klassifizieren diese einzeln, was rechenintensiv ist. YOLO teilt das Bild stattdessen in ein Raster auf und sagt für jede Zelle Bounding Boxes mit Klassenwahrscheinlichkeiten voraus. Das macht es um ein Vielfaches schneller, oft bei nur leicht geringerer Genauigkeit.
Seit der ersten Version von 2016 wurde YOLO laufend weiterentwickelt (YOLOv2 bis YOLOv11 und Varianten). In der Praxis wird es in Überwachungstechnik, autonomem Fahren, Drohnen, Sport-Analytics, industrieller Qualitätssicherung und überall dort eingesetzt, wo Objekte in Echtzeit auf Embedded-Hardware oder am Edge erkannt werden müssen.
Verwandte Begriffe
Vision Transformer (ViT)
Bildverarbeitungsmodell, das die Transformer-Architektur aus dem Sprachbereich auf Bilder…
Attention-Mechanismus
Technik, die einem neuronalen Netz erlaubt, sich bei der Verarbeitung auf die jeweils relevantesten…
Computer Vision
Computer Vision ist ein Teilbereich der künstlichen Intelligenz, der sich mit der automatischen…
Data Mesh
Dezentraler Architekturansatz für Datenmanagement, bei dem Fachbereiche ihre Daten…
Deep Learning
Deep Learning ist ein Teilbereich des maschinellen Lernens, der auf künstlichen neuronalen Netzen…