Computer Use
Neue KI-Fähigkeit, bei der Modelle einen Computer wie ein Mensch bedienen können – mit Mausklicks, Tastatureingaben und visueller Erkennung der Bildschirmoberfläche.
Computer Use bezeichnet die Fähigkeit von KI-Modellen, eine grafische Benutzeroberfläche (GUI) wie ein menschlicher Nutzer zu bedienen. Das Modell sieht den Bildschirminhalt als Screenshot, erkennt Buttons, Textfelder, Menüs und andere Elemente und steuert Maus und Tastatur, um Aufgaben auszuführen.
Diese Technologie wurde 2024 von Anthropic mit Claude erstmals vorgestellt und 2025 von OpenAI mit Operator weiterentwickelt. Der KI-Agent kann damit beliebige Software nutzen, die für Menschen gemacht ist – ohne dass eine spezielle API oder Integration nötig wäre. Er navigiert Websites, füllt Formulare aus, bedient Desktop-Anwendungen und führt mehrstufige Workflows durch.
Computer Use ist ein Durchbruch für die Automatisierung: Viele Geschäftsprozesse nutzen Software ohne API-Schnittstellen – von Legacy-ERP-Systemen bis zu branchenspezifischen Webanwendungen. Computer Use ermöglicht es, auch diese Systeme zu automatisieren. Gleichzeitig birgt die Technologie Risiken: Ein KI-Agent mit Bildschirmzugriff kann potenziell auf alle sichtbaren Informationen zugreifen und unbeabsichtigte Aktionen ausführen. Sicherheitsmechanismen wie definierte Handlungsgrenzen und menschliche Freigabeschritte sind daher essenziell.
Verwandte Begriffe
Agentic AI (Agentische KI)
Autonome KI-Systeme, die eigenständig Ziele verfolgen, Entscheidungen treffen und komplexe Aufgaben…
Tool Use (Function Calling)
Fähigkeit von KI-Modellen, eigenständig externe Werkzeuge, APIs oder Funktionen aufzurufen, um…
Bot
Unter einem Bot versteht man ein Computerprogramm, das wiederkehrende Aufgaben weitgehend…
Intelligente Automatisierung
Die Kombination von künstlicher Intelligenz und Automatisierungstechnologien, um komplexe…
KI-Agent
Ein autonomes System, das in einer Umgebung agiert und Entscheidungen trifft, um bestimmte Ziele zu…