Big Data ist der Begriff für eine neue IT-Technologie. Sie bietet die Möglichkeit, große Datenmengen zu analysieren, zu speichern und auszuwerten. Die gesammelten Daten stammen aus sehr unterschiedlichen Quellen: z.B. aus Unternehmensdaten über Marktanteile, Umsätze und Gewinne oder aus privaten Kommunikationsdaten, wie Internetzugriffen, Kameraaufzeichnungen und Telefongesprächen.
Mittwoch, 20.8.2014 im Sportteil der SZ: Ich denke ich verstehe nicht so richtig, was da steht: „Big Data beim FC Bayern“. Was hat Big Data mit Fußball zu tun? Was ist denn Big Data überhaupt?
Hintergrund ist zunächst, dass die Firma SAP, großer deutscher Softwarehersteller, beim FC Bayern als Investor einsteigt und verspricht: „Wir werden die digitale Welt beim FC Bayern komplett einführen.“
Dass viele Daten bei einem Fußballspiel erzeugt werden, das haben wir mittlerweile mitbekommen. Regelmäßig während eines Spiels werden wir aufgeklärt über %-Anteile im Ballbesitz, über gewonnene Zweikämpfe, über das Eckballverhältnis sowieso oder über Distanzen von Kilometern, die die Spieler gelaufen sind. Mehrere Dutzend Kameras sind auf das Spielfeld gerichtet, identifizieren die einzelnen Spielen und zeichnen ihre Leistungsdaten auf.
So führt Johannes Aumüller in seinem Artikel aus:
„In erster Linie aber geht es um Daten, und zwar um ganz viele Daten, die der FC Bayern für möglichst viele aufbereiten möchte. Für die Fans, für die medizinische Abteilung und vor allem für den Trainerstab. Sie speisen sich aus den aktuellen Spielen, aus den Trainingseinheiten und aus zahlreichen Fernsehaufzeichnungen. Bei einer Trainingseinheit gebe es pro Sekunde eine Million Daten, sagte SAP-Vorstandsmitglied Gerhard Oswald. Im Idealfall soll die Technik helfen, Spiele besser zu analysieren und gesundheitliche Gefahren früher zu erkennen.“
Verstanden habe ich also, dass bei einem Fußballspiel sehr viele Daten gewonnen, gespeichert und ausgewertet werden. Aber was wird wirklich konkret daraus gewonnen?
Schauen wir uns doch zunächst ein anderes Beispiel von Big Data an, z.B. in der Medizin: Wenn das Krankheitsbild eines Menschen durch viele Daten eindeutig gekennzeichnet ist (z.B. Blutwerte, Fettwerte, Urinwerte) und wenn man zugeordnet hat, welche Behandlungsmethoden zur Heilung geführt haben, dann muss man gar nicht mehr den Arzt hinzuziehen, sondern man benötigt die einfache Erfassung der Daten und bekommt als Ergebnis die angewandten Therapieschritte, vorausgesetzt die vorhandene Datenbasis ist groß genug.
Wir ahnen, warum also so viele Daten erforderlich sind und so viele erfasst werden. Big Data ersetzt die Kausalität (in unserem Fall also die Analyse des Arztes) durch Korrelation, also dadurch, dass es viele Daten miteinander in Beziehung setzt.
Auch bei der Übersetzung von Texten aus einer Sprache in eine andere hilft Big Data, ohne dass wir dazu ein Wörterbuch oder einen Übersetzer zu Hilfe ziehen. Voraussetzung ist eben nur eine große Anzahl von übersetzten Texten, die mit zu programmierenden Algorithmen ausgewertet werden.
Siehe dazu auch SZ vom 21.5. 2014, In der Außenansicht, S.2 schreibt Christian Hesse „Der Arzt kann einpacken – Warum man mit Mathematik Menschen heilen kann, ohne etwas von Medizin zu verstehen – und Big Data besser ist als sein Ruf“
Zurück zum Fußball: Der FC Bayern gewinnt sicherlich die meisten seiner Spiele, weil Big Data das aus den Daten seiner Spieler und der Mannschaft vorhersagt. Wird er alle Spiele gewinnen, wenn die Daten dieses belegen? Nun, Gott sei Dank, gibt es noch menschliche Fehler, es gibt die Tagesform, es gibt Pfosten und Latte und es gibt die Schiedsrichter und eben auch andere Mannschaften mit ähnlich guten Leistungsdaten.
Der Artikel in der Außenansicht der SZ endet so:
„Die verantwortliche Nutzung riesiger Datenmengen schafft ungeahnte neue Möglichkeiten. Man kann Energie effizient nutzen, Verbrechen bekämpfen und verhindern, die Wissenschaft voranbringen. Big Data hat einen schlechten Ruf, doch die gesammelten Datenmengen sind nicht per se schlecht. Der Missbrauch von Daten muss natürlich konsequent bekämpft werden. Doch die Chancen von Big Data überwiegen die Risiken.“
Wo sind die Risiken anzusiedeln? Personenbezogene Daten unterliegen nach wie vor den Bestimmungen des BDSG, des Bundesdatenschutzgesetzes. Dieses vertritt das Recht des Bürgers, selbst zu bestimmen über die Speicherung und Verwendung seiner Daten.
Aber können wir überhaupt noch nachvollziehen, welche Daten von wem und wo über uns gespeichert sind und damit auch ausgewertet werden können?
Im US-Film Minority Report[1] wird thematisiert, dass mit Hilfe von Persönlichkeitsprofilen menschliches Verhalten vorhergesagt wird und kriminelle Handlungen prognostiziert werden. Die Algorithmen, die benutzt werden, um die Prognosen zu stützen, sind nicht transparent. Ist das wirklich nur eine Science-Fiction-Vorstellung?
- Minority Report: https://de.wikipedia.org/wiki/Minority_Report