Sind US-Wahlen fälschungssicher?

Verschwörungstheorie? Das Ergebnis der Präsidentschafts-Vorwahlen der Demokratischen Partei vom 5. März 2016 in Louisiana ist statistisch hochgradig auffällig.

Bei diesem Beitrag handelt es sich um ein Blog aus der Freitag-Community.
Ihre Freitag-Redaktion

Warnung: Lesen Sie diesen Artikel vollständig bis zum letzten Anhang oder sonst nicht (hinzugefügt am 5.10.2016)

Einführung

Vor einiger Zeit habe ich in einem Kommentar zu einem Freitag-Artikel auf die Veröffentlichung „An Electoral System in Crisis“ von L. Fries’dat und A. Sampietro verwiesen, die sehr nahe legt, dass die Vorwahlen der Demokratischen Partei zu den Präsidentschaftswahlen 2016 zugunsten von Hillary Clinton und zuungunsten von Bernie Sanders manipuliert wurden. Daraufhin warf mir ein anderer Kommentator vor, ich würde Verschwörungstheorien verbreiten. Diese Woche wurde nun ein sehr lesenswerter Artikel von Houssam Hamade über Verschwörungstheorien und Verschwörungen veröffentlicht, der mich inspiriert hat, dieses Thema am Beispiel des US-Wahlsystems etwas detaillierter zu diskutieren. Nun kann ich an einem Sonntagnachmittag neben einem Waldlauf nicht die gesamte Untersuchung von Fries’dat und Sampietro reproduzieren – Sie würden das in dieser Länge auch nicht lesen wollen. Ich beschränke mich daher auf das spektakulärste Beispiel- die Vorwahl im Bundesstaat Louisiana am 5. März 2016.

Für diesen Fall rekonstruiere ich auf der Basis der öffentlich zugänglichen Originaldaten das Diagramm von Fries’dat und Sampietro und erhalte eine volle Übereinstimmung. Ich zeige zusätzlich, dass auch der Gesamtstimmanteil aller anderen Kandidaten eine statistisch auffällige Abhängigkeit von der Wahlkreisgröße aufweist. Mein Vorgehen beschreibe ich so, dass es jeder Leser mit ausreichenden Computerkenntnissen für diese Wahl und andere Wahlen in Louisiana nachvollziehen kann. Ferner diskutiere ich, was man aus den Daten sicher schließen kann, welche Hypothesen man bilden kann und wie man diese Hypothesen überprüfen könnte.

Methodik

Die Idee von Fries’dat und Sampietro besteht darin, die Ergebnisse nach der Wahlkreisgröße zu sortieren und dann die aufaddierten Stimmen (kumulative Summe) als Prozentanteil der Gesamtstimmen für die beiden führenden Kandidaten aufzutragen. Nach dem in der Statistik bekannten Gesetz der großen Zahlen erwartet man, dass die Stimmanteile für kleine Stimmanzahlen stark variieren, aber sich sehr bald dem Endergebnis annähern und dort verharren. Auf diesem Prinzip beruhen Umfragen und Wahlprognosen während der Auszählung.

Die Ergebnisse aller Wahlen und Abstimmungen in Louisiana seit dem 11. September 1982 kann man auf der Homepage des Secretary of State nach Wahlkreisen aufgelöst in der Form kommaseparierter Wertedateien (.csv) herunterladen. Solche Dateien kann man zum Beispiel mit Excel weiterverarbeiten. Ich persönlich habe die Software Matlab benutzt, was anfangs zu etwas Programmierarbeit führt, aber sich bei der Verarbeitung vieler Datensätze schnell rentiert. Als Ergebnis erhält man eine Tabelle mit den Stimmzahlen aller Kandidaten in allen Wahlkreisen. Die Kategorien „Early Voting“ (von Fries’dat und Sampietro separat aufgetragen) und „Provisional Votes“ habe ich ignoriert. Die Wahlkreisgröße ist hier die Summe der Stimmen aller Kandidaten in einem Wahlkreis. Im Fall der Vorwahl der Demokratischen Partei gab es 10 Kandidaten.

Die Wahlkreise wurden nun nach aufsteigender Größe sortiert. Die kumulative Stimmsumme ist die Summe aller Stimmen eines Kandidaten in allen Wahlkreisen bis zum gerade betrachteten. Teilt man diese kumulative Summe durch die kumulativen Summen aller Kandiadten und multipliziert das Ergebnis mit 100, so erhält man den kumulativen Stimmanteil des Kandidaten bis zu dieser Wahlkreisgröße. Diesen kumulativen Stimmanteil habe ich für Clinton (rot) und Sanders (blau) gesondert und für die anderen 8 Kandidaten zusammen (grau) als Funktion der Gesamtzahl der Stimmen bis zur einer gewissen Wahlkreisgröße aufgetragen. Zusätzlich zeige ich diese Wahlkreisgröße (grün, rechte vertikale Skala) ebenfalls als Funktion der Gesamtzahl der Stimmen. In der Arbeit von Fries’dat und Sampietro findet sich das entsprechende Diagramm auf Seite 19.

Mein Diagramm finden Sie hier.

Ergebnis

Bis zu einer Gesamtzahl von etwa 25‘000 Stimmen sieht das Ergebnis statistisch regulär aus. Danach sollten sich die Anteile der Kandidaten eigentlich kaum noch ändern. Entgegen dieser Erwartung steigt der Stimmanteil Clintons nahezu linear mit wachsender Wahlkreisgröße, derjenige von Sanders fällt nahezu linear. Zwischen den kleinsten und größten Wahlkreisen nimmt der Vorsprung Clintons um 37% zu, worauf bereits Fries’dat und Sampietro hingewiesen haben. Der Anteil aller anderen Kandidaten fällt nichtlinear mit wachsender Wahlkreisgröße, was ebenfalls nicht statistisch regulär ist.

Diskussion

Ich sehe keinen plausiblen Grund, warum Hillary Clinton in den grossen Wahlkreisen einen mehr als 37% grösseren Vorsprung vor Sanders haben könnte, als in den kleinsten. Noch unwahrscheinlicher ist, dass der Vorsprung so regelmässig mit der Wahlkreisgrösse wächst. Diese Befunde sind hochgradig verdächtig.

In den USA werden elektronische Wahlmaschinen benutzt, die praktisch Computer mit Internetzugang sind. Es ist zuvor gezeigt worden, dass diese Computer gehackt werden können. Fries’dat und Sampietro nehmen an, dass das statistisch irreguläre Ergebnis durch eine Manipulation der Wahlmaschinen zu erklären ist. Sie haben dieses Ergebnis und ihre anderen, in die gleiche Richtung weisenden, Ergebnisse mit Fritz Scheuren beraten, der einmal Präsident der Amerikanischen Statistischen Vereinigung war und verschiedene Regierungsstellen der USA in Fragen der Statistik von Umfragen und Wahlen beraten hat. Er ist einer der führenden Experten auf diesem Gebiet in den USA und weltweit. Scheurens Urteil lautet, in Deutsche übersetzt: „Als Statistiker erscheinen mir die Ergebnisse der Vorwahlen 2016 ungewöhnlich. In der Tat fand ich die Muster unerwartet und [möglicherweise sogar] verdächtig. Es gibt hier einen größeren Grad an Glätte als er in rohen Daten oder realen Daten typisch ist.“ Das Ganze sieht eben eher nach dem Ergebnis eines Algorithmus aus als nach einer statistisch zufälligen Korrelation des Stimmanteils mit der Wahlkreisgröße, sofern es eine solche Korrelation überhaupt geben würde.

Um auf den Punkt Verschwörung oder Verschwörungstheorie zu kommen: Die statistische Auffälligkeit ist kein Beweis für eine Manipulation der Wahlmaschinen. So lange mir aber niemand eine plausible Erklärung für diese starke Korrelation und ihre hohe Regelmäßigkeit anbietet, halte auch ich eine Manipulation für die wahrscheinlichste Erklärung, zumal sie eben technisch möglich ist.

Nimmt man eine Manipulation zunächst als Hypothese an, stellt sich immer noch die Frage, wer manipuliert haben könnte. Zwar hatte die demokratische Parteiführung ausweislich ihres E-Mail-Verkehrs ein Interesse, Clinton zu bevorzugen und Sanders zu benachteiligen und sie hat in Vorwahlen allgemein ein Interesse, einen Kandidaten aufzubauen, der sich möglichst klar durchsetzt, weil das die Partei eint und die Chancen in der eigentlichen Wahl verbessert. Andere Seiten können allerdings auch ein Interesse haben. So gibt es etwa die Sponsoren Clintons, deren Einsatz verloren gegangen wäre, wenn sie das Rennen verloren hätte. Nicht einmal Clinton-Gegner sind als Ursache auszuschließen. Eine Manipulation zu Clintons Gunsten, die danach aufgedeckt wird, schadet ihr ja auch, obwohl in diesem Fall die Medien den Skandal sehr effektiv verschwiegen haben. Falls der Umstand einer Manipulation sicher nachgewiesen würde, etwa durch Erkennung einer Schadsoftware, so hielte ich es für eine sichere Wette, dass die demokratische Parteiführung Gegner, zum Beispiel russische Hacker, dafür verantwortlich machen würde.

Houssam Hamade hat verlangt, dass eine kredible Verschwörungstheorie (und eine solche ist meine Hypothese definitiv) widerlegbar sein müsse. Nun ist es mit der Widerlegbarkeit in den Wissenschaften so eine Sache: Ich werfe Popper unsauberes Denken vor, wenn er eine Verifizierung für unmöglich, eine Falsifizierung aber für möglich hält. Von philosophischen Spitzfindigkeiten abgesehen, ist meine Hypothese aber widerlegbar. Dazu benötigt man wenigstens eine statistisch plausible Hypothese, wie die beobachtete Korrelation zustande gekommen sein könnte, ohne dass es eine Manipulation gegeben hat. Diese Hypothese würde meine zwar nicht strikt widerlegen, aber könnte sie doch als wahrscheinlichste Hypothese ablösen.

Noch interessanter ist, ob sich weitere Belege für meine Hypothese finden lassen könnten. Dazu sind zwei Tests von Interesse. Erstens würde man eine ähnliche Abhängigkeit bei den Vorwahlen der Republikanischen Partei in Louisiana erwarten, bei der ja auch ein Anti-Establishment-Kandidat gegen Establishment-Kandidaten angetreten ist. Sollten die Ergebnisse bei dieser Wahl statistisch regulär aussehen, so würde das meine Hypothese, dass bei den Demokraten manipuliert wurde, noch wahrscheinlicher machen. Diese Methodik benutzen Fries'dat und Sampietro auch, allerdings an anderen Beispielen.

Zweitens könnte man sich anschauen, ob es einen solchen auffälligen Trend in Louisiana bei der Demokratischen Partei schon bei vorhergehenden Wahlen gab und ob er immer zugunsten des späteren Siegers lief. Auch diese Methodik haben Fries'dat und Sampietro bereits anhand anderer Beispiele benutzt.

Zusammenfassung

Ich habe hier die Hypothese diskutiert, dass US-Wahlen manipulierbar sind und dass es bei den Vorwahlen der Demokratischen Partei 2016 solche Manipulationen gab. Ich habe mögliche Tests dieser Hypothese beschrieben und werde diese Tests in naher Zukunft durchführen und veröffentlichen. Nach den Präsidentschaftswahlen am 8. November 2016 werde ich den gleichen Test mit den Wahlergebnissen im Bundesstaat Louisiana machen.

Anhang – Historische Entwicklung und Vergleich mit den Republikanern

Der folgende Text wurde einen Tag später, am 3.10.2016 um 20:35 Uhr hinzugefügt.

Eine Auftragung der Wahlergebnisse der Vorwahlen der Demokratischen Partei in Louisiana in den Jahren 2000 und 2004 zeigt keine größeren statistischen Auffälligkeiten. Im Jahr 2000 gab es von kleineren zu größeren Wahlkreisen hin eine gewisse Drift hin zu Gore und weg von Bradley und anderen Kandidaten, doch betrug diese nur wenige Prozent und war vor allem nicht hochgradig regelmäßig. Geradezu statistisch regulär sehen die Ergebnisse von 2004 aus. Zu beachten ist, dass eine kleine Drift sich durchaus mit soziologischen Unterschieden zwischen kleinen Wahlkreisen in ihrer Gesamtheit und großen Wahlkreisen in ihrer Gesamtheit erklären lässt.

Für das Jahr 2008 habe ich erstmals die Vorwahlen der Demokraten und Republikaner verglichen. Die Ergebnisse bei den Republikanern sehen ähnlich aus wie diejenigen der Demokraten 2000 und 2004. Es ist eine kleine Drift zu beobachten, die nicht völlig regelmäßig ist. Insbesondere ist nach dem Aufaddieren der kleinsten Wahlkreise (ab etwa 25‘000 kumulierten Stimmen) nur noch ein sehr schwacher Trend erkennbar. Die Ergebnisse der Demokraten sind schon 2008 hochgradig auffällig. Hier beginnt der eigentliche Trend erst ab etwa 25‘000 kumulierten Stimmen und er ist bis hin zu den größten Wahlkreisen (precincts) nahezu linear zur Anzahl der kumulierten Stimmen. Der Trend ist zugunsten des späteren Siegers Obama und gegen die damalige Verliererin Hillary Clinton.

Im Jahr 2012 ist bei den Republikanern wiederum eine schwache Drift von wenigen Prozent beobachten. Die Ergebnisse der Demokraten sind in diesem Jahr vermutlich nicht sehr aussagekräftig, weil es gegen den amtierenden Präsidenten Obama kein starkes Bewerberfeld gab. Gleichwohl fällt wieder eine sehr starke Drift zugunsten des späteren Siegers Obama ins Auge.

Die letzte der neuen Abbildungen stellt das bereits oben gezeigte Diagramm für die Demokratische Partei von 2016 demjenigen für die Republikanische Partei gegenüber. Wieder beobachtet man bei den Republikanern nur einen schwachen Trend von wenigen Prozent, bei den Demokraten aber den bereits beschriebenen fast linearen Trend zugunsten Hillary Clintons bis hin zu den größten Wahlkreisen.

Anhang 2 – Statistiken zur Wahlkreisgrößenverteilung

hinzugefügt am 4.10.2016, 16:50 Uhr

Aus einer Auftragung der kumulativen Stimmanzahl in Punktform erkennt man, dass die Verteilung der Wahlkreisgrößen "dicht" ist, das lineare Verhalten also keine Konsequenz zu weniger Datenpunkte ist. Es gibt insgesamt 3870 Wahlkreise, in denen mindestens eine Person abgestimmt hat und diese verteilen sich auf 64 Wahlbezirke. Diese Grafik zeigt auch ein Histogramm der Größenverteilung der Wahlkreise. Diese Verteilung ist nicht ungewöhnlich. Zusammen mit der grünen Kurve in der linken Abbildung zeigt sie, dass sich die Stimmanzahl recht gleichmäßig über die Wahlkreisgrößen verteilt, mit Ausnahme lediglich der allergrößten Wahlkreise (>250 Stimmen), die einen geringen Anteil aufweisen. Der Trend ist an dieser Stelle aber bereits voll etabliert und ändert sich nicht.

Einen noch detaillierteren Einblick in diesen Aspekt gibt ein Streudiagramm der Stimmverteilung als Funktion der Wahlkreisgröße, dass ich für die Vorwahlen der Demokraten und Republikaner 2016 angefertigt habe. Um einer wirklichen Verschwörungstheorie vorzubeugen: Die schönen Muster bei kleinen Wahlkreisen haben nichts mit Datenmanipulation zu tun, sondern kommen daher, dass bei wenigen Stimmen nur ausgewählte diskrete prozentuale Stimmanteile möglich sind. Beim Vergleich beider Diagramme sieht man deutlich, dass sich bei den Demokraten von kleinen zu großen Wahlkreisen der Schwerpunkt der Verteilung stark verschiebt. Bei den Republikanern ist das nicht der Fall.

Die Verteilung der Stimmen auf die Wahlkreisgrößen hat ein Maximum bei etwas unter 100 Stimmen, wobei Wahlkreise zwischen 200 und 400 Stimmen immer noch einen erheblichen Anteil beitragen (5.10.2016, 7:25).

Anhang 3 – Ethnische Zugehörigkeit

5.10.2016, 21:20

Die ethnische Zusammensetzung der Wahlkreise als Funktion der Wahlkreisgröße erklärt die sonst statistisch abnormalen Trends bei den Vorwahlen der Demokratischen Partei in Louisiana 2008, 2012 und 2016 zwanglos. Der ethnische Trend mit vorwiegend schwarzen Wählern in großen Wahlkreisen verläuft völlig parallel zum Trend zugunsten Obamas 2008 und 2012 und zugunsten Clintons 2016. Damit ist eine Hypothese gefunden, die wahrscheinlicher ist als diejenige einer Wahlfälschung. Zugleich zeigt sich, dass die hier diskutierte Verschwörungstheorie das Kriterium der Widerlegbarkeit erfüllt.

Dieser Beitrag gibt die Meinung des Autors wieder, nicht notwendigerweise die der Redaktion des Freitag.
Geschrieben von

Gunnar Jeschke

Naturwissenschaftler, in der DDR aufgewachsen, gelebt in Schwarzheide, Dresden, Wako-shi (Japan), Bonn, Mainz, Konstanz und Zürich.

Gunnar Jeschke

Was ist Ihre Meinung?
Diskutieren Sie mit.

Kommentare einblenden