Tag
Alle Begriffe mit dem Tag «Multimodal»
3 Einträge im KI-Lexikon
Gemini
Familie multimodaler Sprachmodelle von Google DeepMind. Bekannt für native Bild-, Audio- und Videoverarbeitung sowie tiefe Integration in…
SprachmodelleLLMMultimodal
Multimodalität
Multimodalität in der KI bezieht sich auf Systeme, die verschiedene Arten von Daten gleichzeitig verarbeiten können, wie Text, Bilder,…
KI & MLMultimodalDatenverarbeitung
VQA (Visual Question Answering)
KI-Aufgabe, bei der ein Modell Fragen in natürlicher Sprache zu einem Bild beantwortet, etwa "Wie viele Personen sind auf dem Foto?".
Computer VisionNLP & SpracheMultimodal