Natural Language Processing

Natural Language Processing (NLP) ist ein Teilbereich der künstlichen Intelligenz, der sich mit der Verarbeitung und dem Verstehen menschlicher Sprache durch Computer beschäftigt. NLP umfasst Aufgaben...

Natural Language Processing, kurz NLP, bezeichnet den Bereich der künstlichen Intelligenz, der sich mit der maschinellen Verarbeitung menschlicher Sprache befasst. Gemeint ist die Fähigkeit von Computern, geschriebene oder gesprochene Sprache nicht nur zu erfassen, sondern auch deren Bedeutung, Struktur und Absicht zu erkennen. Der Begriff stammt aus dem Englischen, im Deutschen spricht man auch von computerlinguistischer Sprachverarbeitung.

Technisch betrachtet zerlegt ein NLP-System Sprache in einzelne Bestandteile wie Wörter, Satzteile und grammatikalische Strukturen und ordnet ihnen Bedeutungen zu. Moderne Verfahren stützen sich dabei meist auf große Sprachmodelle, die anhand riesiger Textmengen trainiert wurden und so Zusammenhänge, Tonfall und Kontext erfassen können. Typische Aufgaben sind die Übersetzung zwischen Sprachen, die Stimmungsanalyse von Kundenbewertungen, die automatische Zusammenfassung langer Texte, das Beantworten von Fragen sowie die Erkennung von Namen, Daten oder Beträgen in Dokumenten. Auch Sprachassistenten und Chatbots beruhen auf NLP.

Für kleine und mittlere Unternehmen ist NLP heute deutlich greifbarer als noch vor wenigen Jahren. Im Kundenservice übernehmen Chatbots wiederkehrende Anfragen, im Marketing wertet Sprachverarbeitung Bewertungen und Erwähnungen in sozialen Netzwerken aus, und im Büroalltag helfen Werkzeuge dabei, E-Mails zu sortieren, Rechnungen auszulesen oder Vertragsklauseln zu prüfen. Auch das Diktieren von Texten, die automatische Erstellung von Protokollen aus Besprechungen oder die Suche in eigenen Dokumentenbeständen funktionieren über NLP. Viele dieser Funktionen stecken bereits in Standardsoftware wie Office-Paketen, CRM-Systemen oder Buchhaltungslösungen und müssen nicht eigens entwickelt werden.

Die Chancen liegen in spürbarer Zeitersparnis und einer einfacheren Bedienung von Software. Grenzen zeigen sich bei Fachsprache, Dialekten, Ironie oder vertraulichen Inhalten, bei denen Datenschutz und Genauigkeit sorgfältig abgewogen werden müssen. Eng verwandt sind die Themen große Sprachmodelle, Spracherkennung und Texterkennung (OCR).

Verwandte Begriffe