YOLO (You Only Look Once)

Computer Vision Echtzeit Architektur

Schnelle Objekterkennungsmethode, die Position und Klasse von Objekten in Bildern in Echtzeit erkennt, durch einen einzigen Vorwärtsdurchlauf des Netzwerks.

YOLO (You Only Look Once) ist eine Familie von Verfahren zur Objekterkennung in Bildern und Videos, die durch ihre Geschwindigkeit und Einfachheit zum Standard für Echtzeitanwendungen geworden ist. Der Name beschreibt das Kernprinzip: Das Bild wird nur einmal durch das neuronale Netz geschickt, das in einem einzigen Schritt sowohl die Position als auch die Klasse aller Objekte vorhersagt.

Klassische Objekterkennungsverfahren (etwa R-CNN) durchsuchen ein Bild in mehreren Schritten nach möglichen Regionen und klassifizieren diese einzeln, was rechenintensiv ist. YOLO teilt das Bild stattdessen in ein Raster auf und sagt für jede Zelle Bounding Boxes mit Klassenwahrscheinlichkeiten voraus. Das macht es um ein Vielfaches schneller, oft bei nur leicht geringerer Genauigkeit.

Seit der ersten Version von 2016 wurde YOLO laufend weiterentwickelt (YOLOv2 bis YOLOv11 und Varianten). In der Praxis wird es in Überwachungstechnik, autonomem Fahren, Drohnen, Sport-Analytics, industrieller Qualitätssicherung und überall dort eingesetzt, wo Objekte in Echtzeit auf Embedded-Hardware oder am Edge erkannt werden müssen.

YOLO (You Only Look Once)

Verwandte Begriffe

Vision Transformer (ViT)

Attention-Mechanismus

Computer Vision

Data Mesh

Deep Learning