Big Data

Big Data bezeichnet Datenmengen, die so groß sind, dass sie kaum mit herkömmlichen Methoden der Datenverarbeitung auszuwerten sind.

Definition Big Data

Big Data stammt aus dem englischen und steht für Datenmengen im Internet und in Unternehmen, die zu groß, komplex oder schwach strukturiert sind, sodass manuelle Methoden der Datenverarbeitung bei der Auswertung an ihre Grenzen stoßen. Deshalb werden heutzutage immer anspruchsvollere technologische Tools benötigt, um diese schnell wachsende Masse an Daten zu bändigen.

Die Menge an Daten lässt sich dabei in vier Faktoren unterteilen:

volume (Umfang, Datenvolumen)
velocity (Geschwindigkeit, mit der die Datenmengen generiert und transferiert werden)
variety (Bandbreite der Datentypen und -quellen)
veracity (Echtheit von Daten).

Wo kommen die Daten her?

Im Zuge der Digitalisierung ist die Menge an Daten in den letzten Jahren rapide angestiegen. Insbesondere die Nutzung von Smartphones und Social Media sorgt für ein stetig wachsendes Volumen an unstrukturierten Daten, die schwer zu verarbeiten sind. Doch auch Überwachungssysteme, EC- oder Kreditkarten, Smartwatches oder andere elektronische Geräte generieren täglich Unmengen an Nutzerdaten, die gespeichert und archiviert werden.

Gerade bei der Speicherung und Analyse personenbezogener Daten kommt es dabei zwangsläufig zu Konflikten mit Datenschutz und Persönlichkeitsrechten. In vielerlei Fällen gibt es vom Nutzer keine Einverständniserklärung zur Verwendung der Daten. Deshalb werden Daten u.a. anonymisiert, es sei denn es gab vorher eine ausdrückliche Einwilligung der Personen.

Wie werden die Daten verarbeitet und ausgewertet?

Die Datenverarbeitung umfasst das Erheben, Erfassen, Speichern, Abfragen, Auslesen, Übermitteln oder Löschen von Daten. Das kann zum Beispiel mit einer Software geschehen. Es gibt heutzutage immer neuere und leistungsstärkere IT-Lösungen und Systeme, mit denen Unternehmen die Datenmassen zu ihrem Vorteil auswerten können. Gerade unstrukturierte Daten aus sozialen Netzwerken können verwendet werden, um beispielsweise online personalisierte Werbung zu schalten. So kann Big Data insbesondere im Marketing, der Technologieentwicklung und bei der Erkennung von Risikopotenzialen von Unternehmen vorteilhaft genutzt werden.

Dabei gibt es bereits verschieden Technologien, die zur Auswertung von Big Data eingesetzt werden. Grid Computing zum Beispiel kann bei der Verarbeitung und Analyse großer Datenmengen helfen. Beim Grid Computing werden viele einzelne Rechner dezentral über ein Netzwerk verbunden und so zu einem virtuellen Supercomputer, der in der Lage ist, komplexe Aufgaben oder Rechenleistungen zu erledigen. Dieses Netz aus Computern kann unstrukturierte Daten ordnen und für Unternehmen auswerten.

Fazit

Eine ganz klare Definition für Big Data gibt es nicht. Es steht einerseits für die Datenmassen, die vor allem durch die Digitalisierung, das Internet und die Nutzung von Smartphones in den letzten Jahren so zahlreich geworden sind, andererseits für die neuen, immer besser werdenden Technologien und Systeme, die diese zum Vorteil von Unternehmen auswerten und analysieren können. Besonders bei der Auswertung von personenbezogenen Daten müssen dabei jedoch genaue Datenschutzrichtlinien eingehalten werden, die in der EU-Datenschutz-Grundverordnung und im BDSG festgehalten sind.