Dieser Beitrag zeigt auf, dass die uneingeschränkte Sammelwut von Daten, Unternehmen auch in Zeiten von Big Data keine Vorteile bringt, sondern vielmehr auch mit Problemen beim Datenschutz verbunden ist.
Der Inhalt im Überblick
Big Data und die Sammelwut
Viele verbinden mit Big Data den Begriff Industrie 4.0 und den Spruch: Daten sind das neue Gold. Das mag sein, soweit die gesammelten und ausgewerteten Daten als Grundlage für Entscheidungsprozesse dienen können oder sogar die Möglichkeit bieten, die Geschäftsfelder von morgen zu erkennen. Dies ist aber nicht immer der Fall.
Definition von Big Data
Unter Big Data versteht man eine Unmenge aus unstrukturierten Daten, die mit herkömmlichen IT-Technologien nicht mehr beherrschbar ist. Aus dieser Datensammlung wird mit Hilfe der vier Dimensionen
- Volume (Datenvolumen)
- Variety (Bandbreite an Datensourcen und Datentypen)
- Veracity (Echtheit der Daten)
- Velocity (Geschwindigkeit)
feingranulare Information gezogen. Algorithmen durchsuchen, analysieren und visualisieren die gewaltigen Datenmengen, um dadurch Antworten auf Fragen zu erhalten, die u.U. zuvor so noch gar nicht gestellt wurden, weil dies nicht möglich war.
Aus Big Data wird Smart Data
Läuft alles optimal, wird aus Big Data durch intelligente Verarbeitung mit dem Einsatz semantischer Technologien Smart Data. Mittels Smart Data kann die Geschwindigkeit und die Qualität der Entscheidungsgrundlagen erheblich verbessert werden, d.h. man erhält zeitnah (Echtzeit) ein geprüftes Wissen oder validiertes Ergebnis in Bezug auf die hinter der Abfrage stehende Fragestellung. Der Unternehmer erfährt mittels Smart Data also bestenfalls nicht nur, was in seinem Unternehmen passiert, sondern auch warum etwas passiert oder was demnächst passieren könnte. Allerdings ist das nur dann der Fall, wenn die auszuwertenden Daten für die Fragestellung nutzbar und geeignet sind, Ergebnisse zu liefern.
Allein schon aus diesem Zusammenspiel von Big Data und Smart Data wird klar, dass die reine unsystematische Datensammlung nichts bringt.
Probleme von Big Data
Die Probleme bei der Anwendung von Big Data liegen auf der Hand:
- Kosten der Sammelwut
Das Speichern der Datenmasse führt nicht nur zu einem hohen CO2-Ausstoss, sondern verursacht auch letztendlich hohe Stromkosten, Kosten für die Speichermedien und die IT-Betreuung. Abgesehen von den rechtlichen Problemen und Bußgeldern, die bei einer unrechtmäßigen Datenverarbeitung, erheblich zu Buche schlagen. - Keine passgenauen Antworten auf drängende Fragestellungen
Viel hilft viel, kostet ja nichts, denkt sich der Sammelwütige! Oftmals weiß er noch nicht einmal, ob er die Daten jemals nützen wird und wofür. Die Analyse inhaltlich nicht zusammenhängender Daten kann auch keine sinnhaften Ergebnisse liefern. - Kenntnis über die vorhandenen Daten
Die fleißigen Datensammler speichern Unmengen von Daten, die nicht genutzt werden. Es gilt der alte Grundsatz: Aus den Augen aus dem Sinn! Zuerst belegen die Daten ungenutzt die Speichermedien und irgendwann weiß man gar nicht mehr, dass man sie hat, d.h. sie werden zu Dark Data. So nennt man die Daten, die nur noch beschränkt nutzbar sind. Es kann nicht mehr vollständig auf diese zugegriffen werden, weil das Speichermedium nicht mehr gelesen werden kann (bspw. Diskette) oder weil sich keiner mehr an diese dunklen Daten erinnert. - Datenschutz bei Big Data
Diese Fragestellung ist wohl die Wesentlichste von allen. Denn auch wenn Dark Data nicht mehr gelesen werden können oder man nicht weiß, dass man die Daten besitzt, so sind diese doch von datenschutzrechtlicher Relevanz.
Vorgaben aus dem Datenschutz bei Big-Data-Anwendungen
Bei Big-Data-Anwendungen sind einige Vorgaben in Bezug auf den Datenschutz zu beachten. Im Wesentlichen sind dies Folgende:
- Datenminimierung
Anders als Smart Data berücksichtigt die blinde Sammelleidenschaft bei Big Data, die wahllos Daten ermittelt nicht den Datenminimierungsgedanken aus Art. 5 Abs. 1 lit. c DSGVO i.V.m. Art. 8 Abs. 2 EU-Grundrechtscharta. Mit anderen Worten Big Data ist grundsätzlich eine unzulässige Vorratsdatenspeicherung. - Zweckbindung
Teilweise werden die Daten ermittelt, ohne damit konkret einen Zweck zu verfolgen (nur zur Sicherheit für alle Fälle!), so dass auch ein Verstoß gegen Zweckbindungsgrundsatz aus Art. 5 Abs. 1 lit. b DSGVO gegeben ist. - Rechtsgrundlage / Einwilligung
Zu beachten ist auch, dass wenn die Daten ursprünglich aufgrund einer Rechtsgrundlage erhoben wurden und dann mit Big Data oder Smart Data für einen anderen Zweck verwendet werden, soweit es sich nicht um eine privilegierte Verarbeitung handelt, wie z.B. Forschung gem. Art. 5 Abs. 1 lit.b 2. HS i.V.m. Art. 89 Abs. 1 DSGVO, eine Zweckänderung gem. Art. 6 Abs. IV DSGVO vorliegt. In diesem Fall muss eine Rechtsgrundlage oder Einwilligung der betroffenen Person gegeben sein. Schwierig dürfte es auch werden, die betroffene Person über die Zweckänderung gem. Art. 13 Abs. 3 DSGVO zu informieren sowie ggf. deren Einwilligung für den neuen Zweck einzuholen. - Dokumentation
Darüberhinaus sind im Verarbeitungsverzeichnis entsprechende Prozesse und die Datenverarbeitungen auch in der Datenschutzerklärung anzuführen.
Was wäre aus der Sicht des Datenschutzes noch zu berücksichtigen?
Niemand soll an seiner Sammelleidenschaft gehindert werden – aber weniger ist oft mehr. Gerade im Hinblick auf mögliche Bußgelder und den oftmals geringen Nutzen der Daten insbesondere, wenn diese überhaupt nicht genutzt werden. Wichtiger wäre es, ganz bewusst für spezifische Fragestellungen konkrete Datengruppen zu erheben und dabei auch gleich an das Löschen zu denken.
Die Aufschieberitis in Bezug auf das Löschen ist in den Unternehmen fast so groß wie deren Sammelleidenschaft. Entscheidend für das erfolgreiche Löschen sind organisatorisch klare Zuständigkeiten. Es sollte eine Person geben, die auch die Entscheidung zum Löschen trifft und regelmäßig die Datenbestände kontrolliert. Daneben kann flankierend eine IT-Unterstützung im Datenmanagement herangezogen werden. Die Haltung, dass man sich erst im späteren Verlauf der Datenverarbeitung Gedanken zum Löschen macht, ist weit verbreitet. Sich von etwas zu trennen ist hart, ein bestehendes Löschkonzept erleichtert das und ist im Hinblick auf Big Data unerlässlich.