Ursprünglich beschreibt der Begriff „Big Data“ Datenbestände, die aufgrund ihres Umfangs, ihrer Unterschiedlichkeit oder ihrer Schnelllebigkeit nur begrenzt durch aktuelle Datenbanken und Daten-Management-Tools verarbeitet werden können.1 Das heißt, sie sind von Menge und Komplexität so groß, dass sie an die Grenzen aktueller Technik stoßen. Diese Definition ist etwas veraltet und bisher nicht durch eine neue ersetzt worden. Denn obwohl die allerorten gesammelten Datenmengen gigantische Dimensionen erreichen, sind inzwischen Computer in der Lage, diese zu verarbeiten. Dabei geht es beispielsweise um Kundendaten, die über lange Zeit akkumuliert werden. Um Bewegungsspuren, die wir beim Durchstöbern des Internets hinterlassen. Smartphones, Smart-TVs, aber auch Navigationsgeräte im Auto melden mannigfaltige Nutzungsdaten zurück an ihre Hersteller. Die Datensammlung geht inzwischen bis in den Keller: Smart Meter ersetzen Stromzähler und protokollieren minuziös den Verbrauch.
Geplant sind bereits Autos, die das Fahrverhalten aufzeichnen und an die Versicherung melden. Praktisch jedes technische Gerät kann inzwischen für Pfennigbeträge mit dem Internet verbunden werden und so Daten aufzeichnen und weitergeben. Wir hinterlassen also Fußabdrücke unterschiedlichster Art, manchmal freiwillig und bewusst, manchmal aber auch unfreiwillig und unwissend.
Orwells Warnung
In Unternehmen und Wissenschaft wird „Big Data“ heiß diskutiert. Durch die inzwischen verfügbare immense Rechen- und Speicherleistung und die zahllosen Datenquellen, ist eine mächtige Grundlage für die Analyse bisherigen und die Prognose künftigen Verhaltens entstanden. Doch wie steht es um die Bevölkerung? Ist „Big Data“ ein bekanntes Thema? Und wie werden Risiken und Chancen wahrgenommen, die sich aus der Erfassung und Auswertung großer Datenmengen im Alltag ergeben? Wir haben im Frühjahr 2014 nachgefragt.2
Die Analogie mit Orwells Begriff „Big Brother“ scheint dem Ansehen von „Big Data“ zu schaden. Denn obwohl gerade einmal 19 Prozent der Befragten den Begriff „Big Data“ schon einmal gehört haben, verbindet jeder Vierte etwas Negatives damit, zwei von drei empfinden ihn neutral. Praktisch niemand kann „Big Data“ Positives abgewinnen.
Unabhängig vom Begriff „Big Data“ haben wir gefragt, wie die Bundesbürger generell zur umfassenden Sammlung von Daten von Privatpersonen und Konsumenten durch Unternehmen stehen. Die Befragten sind hier skeptisch: Über 80 Prozent fürchten, dass persönliche Daten von Unternehmen missbraucht werden. Dieser Vorbehalt zieht sich durch alle Bevölkerungsschichten. Bereits heute wird die Verweigerung von Facebook von vielen auch mit Datenschutzbedenken begründet. So überrascht nicht, dass 86 Prozent auf Nachfrage fordern, dass die Unternehmen offenlegen, welche Daten genau gesammelt werden. Eine heute noch vielfach unerfüllte Erwartung. Möglicherweise wird diese (Nicht-) Transparenz künftig maßgeblich die Entscheidung für oder gegen einen Anbieter beeinflussen.
Skandale wirken!
Annähernd 90 Prozent der Befragten beklagen, dass immer mehr Daten erfasst werden, ohne dass der Einzelne dies beeinflussen könne. Diese Meinung zieht sich durch alle Bevölkerungsschichten gleichermaßen. Es gibt auch erhebliche Bedenken darüber, ob die Unternehmen von ihnen akkumulierte Daten ausreichend vor Missbrauch schützen können. Nach zahlreichen Datenschutzskandalen der Vergangenheit sind die Bundesbürger inzwischen skeptisch: 86 Prozent der Befragten denken, dass es den Unternehmen auch mit viel Mühe nicht gelingen wird, die gesammelten persönlichen Daten vor Missbrauch zu schützen. Sie stufen die Entwicklung zu immer umfassenderen Datensammlungen daher als gefährlich ein.
Mögliche Vorteile durch die umfassende Datensammlung und -analyse durch Unternehmen beeindrucken die meisten Bundesbürger nicht. Lediglich 27 Prozent finden es gut, wenn ihre Daten dazu genutzt werden, gute Produkte zu entwickeln. Die überwiegende Mehrheit kann dieser Option nichts abgewinnen. Eine weitere Möglichkeit, die sich aus der Sammlung und Analyse großer Datenmengen ergibt, wird ebenfalls skeptisch gesehen: 85 Prozent der Befragten können auf Angebote verzichten, die auf Basis der jeweiligen individuellen Daten an jeden Konsumenten persönlich gerichtet sind. Lediglich Personen mit eher geringem ökonomischen Status können sich das etwas häufiger vorstellen. Optimierte Produkte und individualisierte Angebote sind offenbar nicht überzeugend genug, um die Sorgen wegen der umfassenden Datensammlung zu kompensieren.
Kein Weg zurück
Dass der Trend, umfassend Daten zu sammeln und auszuwerten, aufgehalten werden könnte, wird jedoch bezweifelt: 61 Prozent der Deutschen sind der Meinung, dass die Option, große Datenmengen auszuwerten, in Zukunft noch wichtiger für die Wirtschaft wird. Von der jungen Bevölkerung, die sich gerade in der Ausbildung oder im Studium befindet, sind sogar 85 Prozent davon überzeugt.
Im Alltag haben sich die Bundesbürger mehrheitlich längst auf die umfassende Datensammlung und -analyse durch Unternehmen eingelassen. Fast die Hälfte der Deutschen ist auf die eine oder andere Weise online in sozialen Netzen unterwegs. Zwei Drittel haben eine Payback-Karte in ihrem Haushalt, die auch aktiv genutzt wird. Vier von zehn sind ADAC-Mitglied und etwa die Hälfte kauft beim Versandriesen Amazon ein. Das hier mannigfaltig Verbraucherdaten anfallen, dürfte den meisten Bundesbürgern klar sein.
Dass „Big Data“ zudem sehr segensreich genutzt werden kann, etwa wenn die resultierenden Möglichkeiten helfen, Krankheiten zu heilen, die Infrastruktur zu optimieren oder Müll zu vermeiden, sollte zudem nicht vergessen werden. Die Bevölkerung hegt aktuell jedoch große Vorbehalte gegen die umfassende Datensammlung im Alltag. Sie erkennt mögliche Risiken gegenwärtig viel eher als eventuelle Chancen. Ohne eine umfassendere Transparenz, eine größere Datensicherheit und einen nachvollziehbaren Nutzen wird sich die bisher geringe Akzeptanz für die weitreichende Aufzeichnung des Alltags nicht erhöhen lassen. Die Protokollierung ohne Rückhalt in der Bevölkerung kann aber dauerhaft nicht wünschenswert sein.
Echtes Neuland
Für empirische Forschungsinstitute ergeben sich neue Herausforderungen und Chancen. Einerseits sind die neuen Daten interessant, weil hier Informationen zu erwarten sind, die so umfassend nicht zu erheben sind. Im Kontext einer Befragungsmüdigkeit in der Bevölkerung kann auch eine dadurch denkbare Erhebungssparsamkeit positiv gesehen werden. Andererseits stellen sich Herausforderungen bei der Aufrechterhaltung der zugesicherten Anonymität der Befragten, wenn Daten aus anderen Quellen zugespielt werden. Absehbar ist: Je mehr Daten aus unterschiedlichen Quellen miteinander verzahnt werden, desto schwieriger wird es, den Datenschutz sicherzustellen. Nicht zuletzt wird die Beurteilung der Datenqualität eine völlig neue Bedeutung gewinnen. So wird die Qualität von Daten beurteilt werden müssen, deren Entstehung nicht transparent ist. Daten von mäßiger Qualität müssen möglicherweise in Analysen eingebunden werden, weil bessere Alternativen fehlen. Sie dürfen dabei das Niveau der Gesamtauswertung nicht beeinträchtigen. Befragungsdaten müssen zielgerichtet Lücken schließen und Qualitätsabsicherungen liefern. Die neuen Aufgaben sind mannigfaltig und Forschungsinstitute, die sich der Zukunft stellen, aufgrund ihrer Kompetenzen in der Datenerhebung, -aufbereitung und -auswertung gut gerüstet.
Quellen: 1 http://www.enzyklopaedie-der-wirtschaftsinformatik.de/wi-enzyklopaedie/lexikon/ daten-wissen/Datenmanagement/Datenmanagement–Konzepte-des/Big-Data
2 Repräsentative telefonische Befragungen von 1.500 Bundesbürgern ab 18 Jahren im Frühjahr 2014
Zum Weiterlesen: Viktor Mayer-Schönberger, Kenneth Cukier: Big Data. Die Revolution, die unser Leben verändern wird, Redline Verlag 2013 Alex Pentland: Social Physics. How good ideas spread – the lessons from new Science, The Penguin Press 2014