Alle Begriffe mit dem Tag «Sicherheit»
12 Einträge im KI-Lexikon
Adversarial Learning
Beim gegnerischen Lernen wird versucht, ein Modell durch Lernen mit sogenannten gegnerischen Beispielen (Adversarial Examples) robuster…
AI Watermarking
KI-Wasserzeichen betten eine Markierung in KI-generierte Inhalte wie Text oder Bilder ein, um deren Herkunft nachzuweisen und das Eigentum…
Autonomes Fahren
Beim Autonomen Fahren übernimmt ein Autonomes System vollumfänglich die Aufgaben des Fahrers – verlässlich unter verschiedensten…
Constitutional AI
Von Anthropic entwickelter Ansatz, bei dem KI-Modelle anhand eines Satzes von Prinzipien sich selbst korrigieren – für sichere KI mit…
Guardrails
Schutzmechanismen, die festlegen, was eine KI-Anwendung tun darf, was sie sagen darf und welche Eingaben oder Ausgaben blockiert werden.…
Jailbreak
Versuch, die Sicherheitsmechanismen eines KI-Sprachmodells zu umgehen, damit es Inhalte erzeugt, die es eigentlich verweigern soll.
KI-Sicherheit
Die Sicherstellung, dass KI-Systeme robust, zuverlässig und sicher sind. Dies umfasst den Schutz vor Angriffen, die Gewährleistung der…
Prompt Injection
Angriff auf KI-Anwendungen, bei dem manipulierte Eingaben die ursprünglichen Anweisungen eines Sprachmodells umgehen oder überschreiben.…
Red Teaming
Systematischer Stresstest eines KI-Systems durch Angreiferperspektive: Spezialisten versuchen gezielt, Schwächen, Voreingenommenheit und…
RLHF (Reinforcement Learning from Human Feedback)
Trainingsmethode, bei der menschliche Bewerter KI-Antworten bewerten und so das Modell an menschliche Werte und Präferenzen anpassen –…
Shadow AI (Schatten-KI)
KI-Tools und -Anwendungen, die von Mitarbeitenden ohne Wissen oder Genehmigung der IT-Abteilung im Unternehmen eingesetzt werden – ein…
Uncertainty Estimation
Verfahren, mit denen ein KI-Modell einschätzen kann, wie sicher es sich seiner eigenen Vorhersage ist. Wichtig für sicherheitskritische…