Big Data
Mit Big Data werden Mengen von Daten bezeichnet, die zu groß, zu komplex, zu schnelllebig oder zu schwach strukturiert sind, um sie mit herkömmlichen Datenbanksystemen zu verwalten und auszuwerten....
Big Data bezeichnet Datenmengen, die so umfangreich, vielfaeltig oder schnelllebig sind, dass herkoemmliche Datenbanken und Tabellenkalkulationen an ihre Grenzen stossen. Charakterisiert wird der Begriff klassisch durch die sogenannten drei V: Volume (grosses Volumen), Velocity (hohe Geschwindigkeit der Entstehung) und Variety (Vielfalt der Datenformate, etwa Texte, Bilder, Sensordaten oder Protokolldateien). Oft kommen noch Veracity (Verlaesslichkeit) und Value (geschaeftlicher Nutzen) hinzu.
Verarbeitet werden solche Datenmengen mit spezialisierten Systemen, die Speicher und Rechenleistung verteilt nutzen, etwa Cloud-Plattformen oder Werkzeuge wie Hadoop und Spark. Die Daten stammen aus unterschiedlichsten Quellen: Webseiten-Besuchen, Kassensystemen, Maschinen mit Sensoren, sozialen Netzwerken, Lieferketten-Software oder Kundendienst-Protokollen. Ziel ist es, Muster zu erkennen, Vorhersagen zu treffen oder Entscheidungen automatisiert zu unterstuetzen. Big Data bildet damit auch eine wichtige Grundlage fuer Anwendungen der Kuenstlichen Intelligenz, denn maschinelle Lernverfahren werden umso leistungsfaehiger, je mehr aussagekraeftige Daten ihnen zur Verfuegung stehen.
Fuer kleine und mittlere Unternehmen ist Big Data weniger eine Frage der schieren Datenmenge als der klugen Nutzung vorhandener Informationen. Ein Online-Haendler kann etwa Kaufhistorien auswerten, um Lagerbestaende besser zu planen, ein Handwerksbetrieb Sensordaten aus Maschinen nutzen, um Wartungen vorausschauend zu terminieren, und eine Steuerkanzlei Mandantendaten analysieren, um Beratungsbedarf frueher zu erkennen. Praktisch begegnet einem das Thema in Customer-Relationship-Management-Systemen, Warenwirtschaft, Marketing-Plattformen oder im Controlling. Viele Anbieter stellen heute fertige Auswertungswerkzeuge als Cloud-Dienst bereit, sodass auch ohne eigene IT-Abteilung mit grossen Datenbestaenden gearbeitet werden kann.
Chancen liegen in besseren Entscheidungen, Effizienzgewinnen und neuen Geschaeftsmodellen. Grenzen ergeben sich aus Datenschutz, insbesondere der DSGVO, aus der Datenqualitaet und aus dem Aufwand, Daten erst nutzbar zu machen. Eng verwandt sind die Begriffe Data Analytics, Data Mining und Business Intelligence.
Verwandte Begriffe
Data Mining
Data Mining ist ein Prozess der Entdeckung von Mustern in großen Datensätzen. Es wird verwendet, um…
Annotation
Im Kontext der künstlichen Intelligenz (KI) bezieht sich Annotation auf den Prozess, bei dem Daten…
Common Crawl
Common Crawl ist eine gemeinnützige Initiative, die das Web durchforstet, um umfangreiche Archive…
Cosine Similarity
Mathematisches Maß für die Ähnlichkeit zweier Vektoren, Standardverfahren in semantischer Suche und…
Data Labeling
Maschinelle Lernsysteme benötigen oft menschliche Annotatoren, um Daten zu beschriften oder zu…