Pop-Tarts des Terrors

Big-Data-Überwachung Das Department of Homeland Security hat eine Liste mit 377 Schlagwörtern veröffentlicht, nach denen sie das Netz durchforstet. Aber kann das die "echte" Liste sein?

Bei diesem Beitrag handelt es sich um ein Blog aus der Freitag-Community.
Ihre Freitag-Redaktion

Das Wort Big Data habe ich vor circa drei Monaten zum ersten Mal gehört. Das Wort PRISM hörte ich dann gut zwei Monate später. Aber um PRISM mit Big Data zu assoziieren, brauchte mein Hirn nur Bruchteile einer Sekunde.

Ein Artikel von Bernd Graff in der aktuellen Wochenendausgabe der Süddeutschen Zeitung läuft nach ähnlichem Muster ab. Abgedruckt ist eine Liste von 377 Schlagwörtern, die das Department of Homeland Security (DHS) kürzlich freigeben musste.

Es sind Schlagwörter, nach denen das DHS den Datenaustausch im Internet durchforstet. 377 Schlagwörter, „bei deren Verwendung die Agenten tätig werden und berichten sollen.“ (SZ).

Herr Graff wundert sich darüber, dass neben recht offensichtlichen Begriffen wie „terror“, „jihad“ oder „dirty bomb“ unter anderem auch die Wörter „sick“, „snow“ oder „wave“ in dieser Liste auftauchen. Selbst wenn man akzeptiert, dass das DHS neben Terrorakten eben auch nach Klimakatastrophen („snow“) und Krankheiten („sick“) Ausschau hält, scheinen diese Begriffe auf den ersten Blick so allgemein, dass man sich fragen muss, welche konkreten Erkenntnisse daraus bitteschön gewonnen werden sollen.

Doch dann erkennt Graff, dass des Rätsels Lösung etwas mit Big Data zu tun haben muss:

„Die Liste des DHS deutet daraufhin, dass nicht ein einzelnes Instrument zur Aufzeichnung von Verdachtsmomenten im Kampf gegen den Terror und Katastrophen eingesetzt wird, sondern ein gestaffeltes, ineinander übergreifendes Instrumentarium zur Erhebung und Auslese von Big Data Verwendung finden muss. […] Denn anders als Hinweisverstärker zur Verdachtsfindung machen die Suchbegriffe des DHS keinen Sinn.“ (SZ)

In diesem Licht betrachtet erscheint die Liste also als Beweis dafür, dass das DHS (und somit wohl auch die NSA) Big Data Methoden verwendet, nicht in der eigens angeschafften Datenflut zu ertrinken. (Wer hätte es gedacht? Ohne Big Data müsste die Zahl der Angestellten ja vermutlich im Millionenbereich liegen). Ich würde dieses Argument aber gerne auf den Kopf stellen: Big Data ist der Beweis dafür, dass diese Liste nicht die „echte“ Liste sein kann.

Vor drei Monaten kaufte ich mir nämlich ein Buch mit dem Titel Big Data: A Revolution That Will Transform How We Live, Work, and Think. Darin erläutern die Autoren Viktor Meyer-Schönberger und Kenneth Cukier, was Big Data so revolutionär macht - was es so grundlegend von allen bisherigen Erkenntnismethoden unterscheidet.

Eines der wichtigen Alleinstellungsmerkmale von Big Data ist, dass es im Gegensatz zu allen gängigen empirischen Methoden nicht darauf angewiesen ist, im Voraus eine Hypothese aufzustellen. Big Data ist nämlich in der Lage, in zuvor unerreichbarem Umfang nach Korrelationen zu suchen, ohne sich über das „Warum?“ zu scheren. So tauchen Zusammenhänge auf, an die im Vorfeld niemand gedacht hätte.

Bezeichnenderweise spielt auch in diesem Buch das Thema „Klimakatastrophe“ eine entscheidende Rolle:

„In 2004 Walmart peered into its mammoth databases of past transactions: what item each customer bought and the total cost, what else was in the shopping basket, the time of day, even the weather. By doing so, the company noticed that prior to a hurricane, not only did sales of flashlights increase, but so did sales of Pop-Tarts, a sugary American breakfast snack. So as storms approached, Walmart stocked boxes of Pop-Tarts at the front of stores next tot he hurricane supplies.“

Klar, dieses Beispiel bezieht sich auf eine Situation, in der schon alle Bürger über den drohenden Schneesturm informiert sind. Dennoch macht es im übertragenden Sinn eins deutlich: Wenn die Schlagwortliste echt ist und tatsächlich auf Big-Data-Berechnungen beruht – wo stecken dann die „Pop-Tarts“ der Terroristen?

Die Liste enthält jede Menge extrem vager Items – aber sie enthält absolut keine überraschenden. Sie enthält nur das Offensichtliche. Zum Beispiel taucht in ihr so gut wie kein einziger Slang-Begriff auf, den Terroristen oder Drogendealer (auch diese sind im Visier der DHS) für ihre „Produkte“ verwenden würden.

Somit stellt die jetzige Veröffentlichung der Liste auch keine Gefahr für die DHS dar. Es ist nämlich äußerst schwer, sich einen Terroristen vorzustellen, der erst nach dieser Veröffentlichung zu dem Schluss gelangt: „Hey, vielleicht sollte ich in meinen Mails nicht offen über „suicide bombers“ sprechen.“

Das Potenzial von Big Data liegt nicht darin, die Zettabytes an Daten nach altbekannten Reizwörtern wie „nuclear“ zu durchsuchen. Wenn überhaupt liegt das große Potenzial darin, allein durch Korrelationen herauszufinden, welche Codewörter Terroristen für „nuclear“ verwenden!

Ich kann mir schlichtweg nicht vorstellen, dass der größte Überwachungsapparat der Welt dieses Potenzial ungenutzt lässt. Viel besser kann ich mir vorstellen, dass das DHS eine Liste veröffentlicht, die zwar nicht unbedingt gefälscht ist – aber eben nur das ohnehin Offensichtliche preisgibt.

Viktor Mayer-Schonberger und Kenneth Niel Cukier: Big Data: A Revolution That Will Transform How We Live, Work, and Think.
Dieser Beitrag gibt die Meinung des Autors wieder, nicht notwendigerweise die der Redaktion des Freitag.
Geschrieben von

CloseReading

Das Große im Kleinen finden. Einzelne Romanpassagen und Filmszenen durchleuchten. Twitter: @CloseViewing (Filme und Fotografie)

CloseReading

Was ist Ihre Meinung?
Diskutieren Sie mit.

Kommentare einblenden