Tag

Alle Begriffe mit dem Tag «Sicherheit»

12 Einträge im KI-Lexikon

Beim gegnerischen Lernen wird versucht, ein Modell durch Lernen mit sogenannten gegnerischen Beispielen (Adversarial Examples) robuster…

KI-Wasserzeichen betten eine Markierung in KI-generierte Inhalte wie Text oder Bilder ein, um deren Herkunft nachzuweisen und das Eigentum…

Beim Autonomen Fahren übernimmt ein Autonomes System vollumfänglich die Aufgaben des Fahrers – verlässlich unter verschiedensten…

Von Anthropic entwickelter Ansatz, bei dem KI-Modelle anhand eines Satzes von Prinzipien sich selbst korrigieren – für sichere KI mit…

Schutzmechanismen, die festlegen, was eine KI-Anwendung tun darf, was sie sagen darf und welche Eingaben oder Ausgaben blockiert werden.…

Versuch, die Sicherheitsmechanismen eines KI-Sprachmodells zu umgehen, damit es Inhalte erzeugt, die es eigentlich verweigern soll.

Die Sicherstellung, dass KI-Systeme robust, zuverlässig und sicher sind. Dies umfasst den Schutz vor Angriffen, die Gewährleistung der…

Angriff auf KI-Anwendungen, bei dem manipulierte Eingaben die ursprünglichen Anweisungen eines Sprachmodells umgehen oder überschreiben.…

Systematischer Stresstest eines KI-Systems durch Angreiferperspektive: Spezialisten versuchen gezielt, Schwächen, Voreingenommenheit und…

Trainingsmethode, bei der menschliche Bewerter KI-Antworten bewerten und so das Modell an menschliche Werte und Präferenzen anpassen –…

KI-Tools und -Anwendungen, die von Mitarbeitenden ohne Wissen oder Genehmigung der IT-Abteilung im Unternehmen eingesetzt werden – ein…

Verfahren, mit denen ein KI-Modell einschätzen kann, wie sicher es sich seiner eigenen Vorhersage ist. Wichtig für sicherheitskritische…