Zum Inhalt springen Zur Navigation springen
Möglichkeiten von Big Data: Suchmaschine diagnostiziert Krebs

Möglichkeiten von Big Data: Suchmaschine diagnostiziert Krebs

Kaum eine Woche vergeht, in der es keine Meldungen von neuen Spielchen mit großen Datensätzen (Big Data) gibt. Staunen, anerkennendes Nicken und ein mulmiges Gefühl sind Reaktionen, die beim Lesen dieser Meldungen oft nah beieinander liegen. Ein Beispiel aus dem Hause Microsoft und die Zahlen zum Einsatz von Big Data Analysen in deutschen Unternehmen sollen ein Bild der aktuellen Lage vermitteln.

Wenn die Suchmaschine Krebs diagnostiziert

In der vergangenen Woche veröffentlichten Wissenschaftler von Microsoft Research und der Columbia University eine Studie, nach der sie anhand von Suchbegriffen, die Nutzer in die Suchmaschine Bing eingegeben haben, Bauspeicheldrüsenkrebs frühzeitig erkennen können.

Hierfür arbeiteten sich die Wissenschaftler durch die Suchhistorie von Personen, bei denen Bauspeicheldrüsenkrebs diagnostiziert wurde (eine Information, die die Forscher ebenfalls ausschließlich den Suchbegriffen entnahmen) und stellten Gemeinsamkeiten fest.

Dabei standen Symptome und Risikofaktoren im Mittelpunkt, über die sich die Betroffenen informierten, lange bevor der Bauchspeicheldrüsenkrebs bei ihnen erkannt wurde. Insgesamt wurden Datensätze von 9,2 Millionen US-Nutzern ausgewertet, deren Suchanfragen jeweils über einen Zeitraum von bis zu 18 Monate aufgezeichnet wurden.

5 bis 15 Prozent der Bauspeicheldrüsenkrebserkrankungen konnten die Wissenschaftler aufgrund ihrer Erkenntnisse frühzeitig identifizieren. Die false postive rate, also die Häufigkeit bei der die Wissenschaftler fälschlicherweise davon ausgehen, dass eine Person erkrankt ist, wird mit 1 zu 100.000 angegeben und ist damit erstaunlich gering.

Studien wie diese lassen erahnen, wohin die Reise geht und welchen Nutzen Datenanalysen haben können. Gleichzeitig offenbaren sie, wie viele Informationen sich aus unserem Verhalten im Internet extrahieren lassen.

Auswertung von Suchbegriffen ist in der Medizin nicht verbreitet

Die Auswertung von Suchbegriffen für medizinische Studien ist derzeit nach Aussage von Dr. Eric Horvitz, eines der Autoren der Studie, nicht üblich. Der New York Times gegenüber deutete er aber ein mögliches Umdenken an:

„I think the mainstream medical literature has been resistant to these kinds of studies and this kind of data … We’re hoping that this stimulates quite a bit of interesting conversation.“

Steigender Anteil der Unternehmen in Deutschland nutzt Big Data

Meldungen, wie die obige erreichen uns häufig aus den USA. Aber auch in Deutschland vergrößert sich die Anzahl von Unternehmen, die auf Big Data Analysen setzen.

Nach dem Ende der vergangenen Woche von der KPMG in Zusammenarbeit mit der bitkom veröffentlichten Bericht „Mit Daten Werte schaffen – Report 2016“ setzen in Deutschland bereits 35 Prozent der Unternehmen Big Data Lösungen ein. Etwa zwei Drittel haben Interesse an dem Thema.

Weshalb zögern viele Unternehmen?

Bei den Vorbehalten gegen eine intensivere Nutzung von Datenanalysen benennen Unternehmen vor allem die Weitergabe von Daten an Drittanbieter, die anfallenden Kosten, das Fehlen von Spezialisten für die Analyse der Daten und die unsichere Rechtslage.

Vereinbarkeit mit dem Datenschutzrecht

In der Tat gilt es datenschutzrechtliche Grundsätze zu beachten, wenn personenbezogene Daten in die Analyse einfließen. Die genannte Studie wurde übrigens mit anonymisierten Daten durchgeführt und ist daher datenschutzrechtlich unbedenklich. Der „Echtzeit-Einsatz“ ließe sich allenfalls über eine Einwilligung der Nutzer rechtskonform gestalten.

Für Unternehmen und Wissenschaftler, die sich für den Einsatz von Big Data Technologien konkret interessieren, hat die bitkom die folgenden Leitlinien erarbeitet:

  1. Nutzen der Big-Data Anwendungen prüfen
  2. Anwendungen transparent gestalten
  3. Bevorzugt anonymisierte oder pseudonymisierte Daten verarbeiten
  4. Interessen der Beteiligten abwägen
  5. Nutzen für Betroffene schaffen
  6. Governance für personenbezogen Daten etablieren
  7. Daten wirksam gegen unberechtigte Zugriffe schützen
  8. Keine Daten zu ethisch-moralisch unlauteren Zwecken verarbeiten
  9. Datenweitergabe nach Interessenabwägung ermöglichen
  10. Selbstbestimmtes Handeln ermöglichen
  11. Politische Rahmenbedingung vervollkommnen – Datenschutz und Datennutzen neu abwägen.

Den Leitfaden für den Einsatz von Big Data Technologien können sie hier einsehen.

Informieren Sie sich über unsere praxisnahen Webinare
  • »Microsoft 365 sicher gestalten«
  • »Informationspflichten nach DSGVO«
  • »Auftragsverarbeitung in der Praxis«
  • »DSGVO-konformes Löschen«
  • »IT-Notfall Ransomware«
  • »Bewerber- und Beschäftigtendatenschutz«
Webinare entdecken
Mit dem Code „Webinar2024B“ erhalten Sie 10% Rabatt, gültig bis zum 30.06.2024.
Beitrag kommentieren
Fehler entdeckt oder Themenvorschlag? Kontaktieren Sie uns anonym hier.
Die von Ihnen verfassten Kommentare erscheinen nicht sofort, sondern erst nach Prüfung und Freigabe durch unseren Administrator. Bitte beachten Sie auch unsere Nutzungsbedingungen und unsere Datenschutzerklärung.