Computer Vision
Computer Vision ist ein Teilbereich der künstlichen Intelligenz, der sich mit der automatischen Analyse und Interpretation visueller Informationen aus Bildern und Videos beschäftigt. Es ermöglicht Com...
Computer Vision bezeichnet das Fachgebiet der künstlichen Intelligenz, das Maschinen befähigt, visuelle Inhalte aus Bildern und Videos zu erkennen, zu analysieren und zu interpretieren. Anders gesagt: Während ein Mensch auf einen Blick sieht, ob auf einem Foto ein Fahrrad steht oder ob eine Verpackung beschädigt ist, muss ein Computer dies erst lernen. Computer Vision liefert die Verfahren dafür und gehört heute zu den ausgereiftesten Anwendungsfeldern der KI.
Technisch basiert Computer Vision meist auf neuronalen Netzen, die mit grossen Mengen an Beispielbildern trainiert werden. Aus diesen Daten lernt das System Muster zu erkennen, etwa Kanten, Formen, Farbverteilungen oder typische Anordnungen von Objekten. Typische Aufgaben sind die Bildklassifikation (Was ist auf dem Bild zu sehen?), die Objekterkennung (Wo befindet sich was?), die Segmentierung (welche Pixel gehören zu welchem Objekt?) sowie die optische Zeichenerkennung (OCR), die Text aus Bildern ausliest. Auch Gesichts- und Bewegungserkennung fallen in dieses Feld.
Für kleine und mittlere Unternehmen ist Computer Vision in vielen Bereichen praktisch nutzbar geworden, weil leistungsfähige Bibliotheken und fertige Cloud-Dienste verfügbar sind. In der Fertigung übernehmen Kameras die Qualitätsprüfung und entdecken Kratzer, fehlende Bauteile oder Masstoleranzen schneller als das menschliche Auge. Im Handel lassen sich Regalbestände automatisch erfassen, in der Landwirtschaft werden Pflanzenkrankheiten per Drohnenaufnahme erkannt, in Arztpraxen unterstützen Bildverfahren die Auswertung von Aufnahmen. Auch ganz alltägliche Anwendungen wie das automatische Auslesen von Rechnungen, das Sortieren von Fotos oder die Zutrittskontrolle per Gesichtserkennung beruhen auf Computer Vision.
Grenzen liegen in der Datenqualität: Schlechte Beleuchtung, ungewohnte Blickwinkel oder zu wenige Trainingsbilder führen schnell zu Fehlern. Zudem sind beim Einsatz datenschutzrechtliche Fragen zu beachten, vor allem wenn Personen erfasst werden. Verwandte Begriffe sind Bildverarbeitung, Mustererkennung und Deep Learning.
Verwandte Begriffe
Image Segmentation
Computer-Vision-Verfahren, bei dem jedem Pixel eines Bildes eine Klasse zugeordnet wird und damit…
Data Mining
Data Mining ist ein Prozess der Entdeckung von Mustern in großen Datensätzen. Es wird verwendet, um…
Deepfake
Deepfake ist ein Begriff, der aus "Deep Learning" und "Fake" entstanden ist und sich auf die…
Text Mining
Text Mining umfasst das Ableiten aussagekräftiger Erkenntnisse aus unstrukturierten Textdaten…
Unsupervised Learning (Unüberwachtes Lernen)
Ein Typ des maschinellen Lernens, bei dem das Modell mit ungelabelten Daten trainiert wird. Das…