Dark Data

von | 25.01.2021 | Prozesse & Methoden |

Dark Data – Das Geschäftsmodell mit den Daten!

Stellen Sie sich vor, ein ehemaliger Google- und ein ehemaliger Pinterest-Mitarbeiter entwickeln gemeinsam eine neue App. Die App möchte eine Kombination aus sozialem Netzwerk und Audio-Plattform sein. Ziel ist es, Menschen die Möglichkeit zu geben, miteinander zu diskutieren. Die App wird im Beta-Status1 veröffentlicht und läuft nur auf Apple-Endgeräten. Doch mit der richtigen Idee müssen diese Einschränkungen kein Nachteil sein. Eine Marketingstrategie zur Steigerung der Nachfrage und zur Nutzung des FOMO-Effekts (fear of missing out)2 wird gesucht. „Lass uns Einladungen verwenden! Nur wer eine Einladung eines aktiven Nutzers erhält, kann mitmachen! Und wenn wir später genug Reichweite haben, öffnen wir das Netzwerk für jedermann!“ Gesagt, getan. Nicht mal ein Jahr später hat die App 600.000 Nutzer3, Tendenz stark steigend. Und sie wird mit knapp 100 Millionen US-Dollar bewertet4. Das klingt nach einer schönen Erfolgsgeschichte, oder? Von null auf 100 Millionen in weniger als einem Jahr. Beeindruckend!

Wie würden Sie es finden, wenn dieses Unternehmen Ihre Kontaktdaten besitzt? Und zwar nicht, weil Sie sich entschieden haben, die App zu nutzen, sondern weil Sie jemanden kennen, der sie nutzt. Dieser Jemand hat der App Zugriff auf Ihre Kontaktdaten gewährt. Natürlich nicht in böser Absicht. Es hat Sie zwar nicht gefragt, ob Sie das wollen, aber was soll schon passieren? „Das Unternehmen hat bestimmt kein besonders Interesse an der Nutzung der Daten!“ Allerdings steht dann die Frage im Raum, warum der Zugriff auf die Daten explizit von der App gefordert wird! Die Motive bleiben im Dunkeln. Und für Daten, die so oder so ähnlich von Unternehmen gesammelt werden, gibt es einen Begriff: Dark Data.

Was ist Dark Data?

Das amerikanische Marktforschungsunternehmen Gartner definiert Dark Data als „the information assets organizations collect, process and store during regular business activities, but generally fail to use for other purposes (for example, analytics, business relationships and direct monetizing). Similar to dark matter in physics, dark data often comprises most organizations’ universe of information assets. Thus, organizations often retain dark data for compliance purposes only. Storing and securing data typically incurs more expense (and sometimes greater risk) than value“.5

Frei ins Deutsche übersetzt: „Dark Data sind die Informationsbestände, die Unternehmen im Rahmen ihrer regulären Geschäftsaktivitäten sammeln, verarbeiten und speichern, aber in der Regel nicht für andere Zwecke nutzen (z. B. für Analysen, Geschäftsbeziehungen und direkte Monetarisierung). Ähnlich wie die dunkle Materie in der Physik bildet Dark Data oft das Universum der Informationsressourcen der meisten Organisationen. Daher bewahren Unternehmen Dark Data oft nur für Compliance-Zwecke auf. Die Speicherung und Sicherung von Daten verursacht in der Regel mehr Kosten (und manchmal auch größere Risiken) als Nutzen“.

Ehrlich gesagt halte ich von der Definition wenig, denn

  • sie passt deutlich besser zu Small Data als zu Dark Data. Small Data sind Daten, die in Unternehmen zwar vorhanden sind, aber nicht aktiv genutzt werden, also bspw. ungenutztes Kundenfeedback. Small Data zielt jedoch nicht nur auf Kunden, Anwender oder Konsumenten, auch Mitarbeiter können davon profitieren. (Mehr darüber – auch zur Abgrenzung zu Smart Data und Big Data – finden Sie in diesem Blogbeitrag.)
  • die tatsächliche Nutzung von Daten ist oftmals nicht mal im Ansatz von außen zu erkennen. Zudem entwickelt sie sich häufig in Richtungen, die zum Zeitpunkt der Erhebung nicht mal intern erkannt waren.6 Die Monetarisierung von Daten bei Google, Facebook, WhatsApp, Twitter und Co. lässt grüßen.
  • Compliance adressiert etwas anders. Natürlich bewahren Unternehmen Daten aus Compliance-Gründen auf. Sie nutzen investigative, präventive und reaktive Compliance-Management-Systeme und versuchen so u.a. strafrechtliche Taten, die aus einem Unternehmen begangen werden könnten, zu verhindern.7 Das hat aber nichts mit der Datensammelwut von Unternehmen zu tun.
  • die Speicherung von Daten ist heutzutage sehr günstig. Vorbei sind die Zeiten, in denen Mails ausgedruckt und in dicken Ordnern in Schränken gelagert wurden. Tatsächlich gibt es inzwischen sogar Forderungen, Internet-Giganten nicht mehr nur nach Gewinnen, sondern nach gespeicherten Datensätzen zu besteuern.6
  • wo sollten Risiken liegen?
  • das Sammeln und Monetarisieren von Daten ist längst ein gängiges Geschäftsmodell in zahlreichen Branchen!

Kurzum: ich schlage eine andere Definition von Dark Data vor: „Dark Data sind die Informationsbestände, die Unternehmen im Rahmen ihrer Geschäftsaktivitäten oder im Rahmen der Geschäftsaktivitäten verbundener Unternehmen sammeln, verarbeiten und speichern, und in der Regel für umfangreiche Analysen und Prognosen, die Anbahnung von  Geschäftsbeziehungen und die direkte und indirekte Monetarisierung nutzen.“

Klingt auf den ersten Blick leider etwas beängstigend. Und das ist es auch!

Beispiele für Dark Data

Welche Beispiele gibt es für Dark Data? Welche Unternehmen monetarisieren Daten? Natürlich die üblichen Verdächtigen, global agierende Internetriesen wie Google, Facebook, Tiktok etc. Da die Dienste dieser Giganten im wahrsten Sinne des Wortes Weltklasse sind, stören sich viele Anwender auch nicht an der Verwendung ihrer Daten im Tausch dafür.

  • Wenn Netzwerkbetreiber wie Telekom oder Vodafone ihr Handy in Funkzellen verorten, warum sollte Google Maps nicht den Standort Ihres Handys nutzen, um Stauinformationen zu kalkulieren?
  • Warum sollte die Suchmaschine Google Ihre Suchanfragen nicht dazu nutzen, um ähnliche Suchanfragen von anderen Nutzern automatisch zu vervollständigen? (Interessanterweise sind nicht nur die eigentlichen Suchergebnisse bei Google individualisiert, sondern auch die Autovervollständigungen.) Eine Antwort auf diese Frage hat der Bundesgerichtshof bereits 2013 gegeben: wenn Persönlichkeitsrechte von Nutzern verletzt werden. 8

Facebook geht bei der Verwendung von Dark Data noch einen ganzen Schritt weiter. Werbetreibende können dort nicht nur Werbeanzeigen für eine „Core Audience“ mit definierten Merkmalen wie Alter, Standort oder Endgerät schalten, sondern in der Folge spezifische Merkmale, Einstellungen oder Vorlieben der klickenden Interessenten nutzen, um eine „Lookalike Audience“ mit ähnlichen/identischen Merkmalen anzusprechen. Das ist ein vollkommen legaler Weg, mit dem sich bspw. leider auch die Meinungsbildung in einem politischen Prozess beeinflussen lässt.

Gibt es weitere Beispiele für die Verwendung von Dark Data, fernab der Internetriesen? Ja. Allerdings sind diese weniger prominent. Einerseits natürlich weil Unternehmen damit selten öffentlich kokettieren. Aussagen wie „Wir nutzen progressive Profiling-Formulare und holen uns Schritt für die Schritt die Infos die wir brauchen. Klappt ganz gut.“9 lassen sich evtl. in Foren finden, aber nicht in der Rubrik „Über uns“ auf einer Website. Und andererseits weil sie einfach übersehen werden. Dazu einige Beispiele:

  • Wenn Ihnen auf einer Website ein PDF zum Mitnehmen angeboten wird und der Webseitenbetreiber möchte Ihnen das Dokument zuschicken, welche Daten benötigt er dazu? Ihre E-Mail-Adresse offensichtlich. Warum benötigt er Ihren Namen? Ihre Adresse, Ihre Position im Unternehmen, Ihre Unternehmensgröße und Ihre Telefonnummer? Bestimmt ist es nett, wenn Sie mit Ihrem Namen in der Liefermail angesprochen werden. Und der Rest? Dark Data! Der Vertrieb möchte die Daten nutzen, um Sie als Lead zu qualifizieren und als Kunden zu gewinnen. Ohne Ihre explizite Zustimmung und eine separate Verifizierung der Telefonnummer dürfte er Sie zwar nicht anrufen, aber wo es keinen Kläger gibt, findet sich auch kein Richter.10
  • Wie kommt es wohl, dass Sie regelmäßig Newsletter erhalten, Sie sich aber sicher sind, dass Sie sich nie für den Versand eingetragen haben?
  • Wie ist es möglich, dass Eltern direkt nach der Geburt eines Kindes „passende“ Werbung und Tipps in ihrem Briefkasten finden. Vielleicht monetarisieren Krankenhäuser entsprechende Informationen, ziemlich sicher erfolgt aber die Weitergabe der Daten durch das Einwohnermeldeamt!11

 Immerhin gibt es auch eine gute Nachricht: in Deutschland und in der Europäischen Union existieren klare Regeln zum Datenschutz!

Datenschutz ist …

Seit dem 25. Mai 2018 gilt die europäische Datenschutzverordnung. „Datenschutz wird in Zukunft ein wichtiger Wettbewerbsfaktor“ war sich ein Anwalt seinerzeit auf einer Informationsveranstaltung sicher. Ich bin nicht sicher, ob ich seither nochmals eine Aussage gehört habe, die so wenig mit der Realität zu tun hatte, wie diese Prognose. Dazu ein kleines Beispiel von unserer Website:

  • 2020 hatten wir 663.547 Seitenaufrufe und 10.360 Downloads wurden getägtigt.
  • Zur Bestätigung des Versands eines gewünschten Dokuments müssen Interessenten unsere Datenschutzerklärung akzeptieren. Natürlich ist diese direkt verlinkt und leicht mit einem Klick in einem separaten Tab zu lesen. Im Wesentlichen besagt sie, dass wir die E-Mail-Adresse (mehr erheben wir nicht) zum Versenden des Dokuments nutzen. Punkt.

Wie häufig wurde wohl unsere Datenschutzerklärung im letzten Jahr aufgerufen? Die Antwort lautet: 451 Mal. Bezogen auf die Downloads sind das 4,35%, bezogen auf die Seitenaufrufe 0,068%. Noch Fragen?

Datenschutz ist für viele Menschen nicht wirklich wichtig. Das ist zwar schade, aber wissen Sie was für Menschen noch unwichtiger ist? Der Datenschutz von anderen Menschen! Nur so ist es möglich, dass eine App, die Zugriff auf sämtliche Daten der Kontakte des Anwenders fordert, 100 Millionen Dollar wert ist. Nur so funktioniert Dark Data.

Dark Data: Nutzen oder Finger weg?

Unabhängig davon, dass viele kleine und mittelgroße Unternehmen weder das Wissen noch die Kapazitäten haben, Daten zu monetarisieren, steht eine Frage im Raum: Sollte man Dark Data nutzen oder die Finger davon lassen? Sollte man bspw. versuchen, E-Mails-Adressen, Bewertungen in Portalen, Backlinks oder Follower für diverse Social Media Plattformen zu kaufen? Sollte der Vertrieb aktiv werden, wenn ein Lead beim Download eines Dokuments keine Zustimmung zur Kontaktaufnahme erteilt hat? Sollten auf LinkedIn eine Social Selling Automation aktiviert, über Ihre Website datengetriebene Personas entwickelt oder „Do not track“-Einstellungen der Websitebesucher akzeptiert werden?

Moralisch dürften die meisten dieser Fragen relativ leicht zu beantworten sein. Leider bezahlt Moral selten Rechnungen. Hinzu kommt, dass diejenigen, die von Dark Data nicht profitieren wollen (und Datenschutz ernst nehmen), in gewisser Art benachteiligt sind. Eine Sales Pipeline lässt sich durch den Einwurf weniger Geldstücke ziemlich einfach extern füllen und eine gefüllte Sales Pipeline erhöht die Chancen auf Umsätze. Entscheidet sich ein Unternehmen aktiv für die interne Sammlung, Verarbeitung, Speicherung und Monetarisierung von Dark Data, werden zwar mehr Geldstücke benötigt, dennoch dürften bereits ein oder zwei Neukunden den Aufwand rechtfertigen. Und wenn es dem Unternehmen dann noch gelingt, ein skalierendes System zu etablieren, wird daraus vielleicht sogar noch ein Geschäftsmodell!

Also: Nutzen oder Finger weg?

Meine persönliche Antwort auf die Frage lautet: Finger weg! Ich möchte mich lieber auf unsere Kunden konzentrieren. Ich finde es besser, wenn wir unsere Energie in die  die konkrete Entwicklung von Produkten und die Verbesserung unserer Dienstleistung stecken. Und wenn ich mir die Arbeit meiner Kolleginnen und Kollegen anschaue, sehen die das auch so.

Ein letzter Gedanke zum Schluss: Vielleicht erhalten Sie demnächst eine Einladung zu einer App, die ein soziales Netzwerk und eine Audio-Plattform kombiniert. Falls Sie  meine Handynummer kennen, lehnen Sie die Einladung doch einfach ab und verabreden Sie sich stattdessen lieber mit mir auf ein Walk-and-Talk-Kaffee. Wir können gerne auch über etwas anderes als Dark Data diskutieren. Und natürlich bezahle ich auch den Kaffee! 😉

 

Hinweise:

[1] Beta-Version: ein früher Entwicklungsstand einer Software
[2] FOMO-Effekt
[3] Willkommen im Club
[4] Silicon Valles is going crazy …
[5] Definition von Gartner
[6] Unbedingte Empfehlung: The Social Dilemma
[7] Compliance ist Pflicht für Unternehmen
[8] Autocomplete-Funktion: Bettina Wulff und Google einigen sich
[9] Diskussion auf LinkedIn über die Optimierung von Formularen
[10] Wichtiges Urteil: Ist das DSGVO Kopplungsverbot Vergangenheit?
[11] Bundesmeldegesetz: Datenweitergabe durch Meldebehörden

Michael Schenkel hat im t2informatik Blog weitere Beiträge veröffentlicht, u. a.

t2informatik Blog: Geschwindigkeit als unfairer Vorteil

Geschwindigkeit als unfairer Vorteil

t2informatik Blog: Der Organisationsrebell - doch eine gute Idee?

Der Organisationsrebell – doch eine gute Idee?

t2informatik Blog: Programmieren in der Schule lernen

Programmieren in der Schule lernen

Michael Schenkel
Michael Schenkel

Leiter Marketing, t2informatik GmbH

Michael Schenkel ist Diplom-Betriebswirt (BA) und macht Marketing mit Leidenschaft. Er bloggt gerne über Projektmanagement, Requirements Engineering und Marketing. Und er freut sich, wenn Sie ihn auf eine Tasse Kaffee und ein Stück Kuchen treffen.