Die ewige Epidemie

Covid-19 Die Überlagerung von SARS-Cov2-Testdaten mit Sterbefallzahlen zeigt eine Reihe von Auffälligkeiten.
Bei diesem Beitrag handelt es sich um ein Blog aus der Freitag-Community

„Natürlich war es falsch, die Grenzen zu schließen. Das ist inzwischen auch nicht mehr bestritten.“

Wolfgang Schäuble im Interview mit dem Schweizer Fernsehen SRF, 19. Juni 2020, im Transkript nicht wiedergegeben, aber heute vom Schweizer Radio DRS gesendet

Überlagerung von Test- und Sterbedaten - Warum und wie

Ich verspreche gleich am Anfang, dass es heute nur ganz wenig Mathematik gibt und dass sie einfach ist. Die Grundidee ist, dass die zeitliche Entwicklung durch Covid-19 bedingter Sterbefälle zu derjenigen der positiven SARS-Cov2-Tests in einer engen Beziehung stehen muss. Wenn dem nicht so wäre, dann wäre jegliche Diskussion der Zahl positiver Tests verschwendete Zeit. Für die Art der Beziehung kann man eine einfache Hypothese aufstellen. Die Sterbefälle sind gegenüber den Tests zeitlich verzögert. Diese Verzögerungszeit ist nicht scharf definiert, sondern weist eine gewisse Verteilungsbreite auf. Zudem wird die Zahl der Sterbefälle nur ein Bruchteil der Zahl der positiv verlaufenen Tests sein. Solange die Zahl der Tests pro Tag und die Art der Auswahl der getesteten Personen sich nicht stark ändern und die Therapie von Covid-19 keine starken Fortschritte macht, sollte dieser Bruchteil zeitlich konstant sein. Zusätzlich nehme ich eine Normalverteilung der Verzögerungszeit an. Wie der Name der Verteilung sagt, tut man das, wenn man keine guten Gründe hat, eine andere Verteilung anzunehmen.

Mit diesen Annahmen lässt sich der erwartete Zeitverlauf der Sterbefälle aus dem gemessenen Zeitverlauf der positiven Tests durch die mathematische Operation der Faltung (englisch: convolution) mit einer Normalverteilung berechnen. Natürlich benötigen wir noch die drei Parameter: die mittlere Zeitverzögerung, die dem Erwartungswert der Normalverteilung entspricht, die Verteilungsbreite, die wir durch die Standardabweichung charakterisieren und den Bruchteil der tödlich verlaufenden Infektionen in der durch die Teststrategie ausgewählten Bevölkerungsgruppe. Diese Parameter kann man durch eine Anpassung ermitteln, die die beiden Datensätze nach der Faltung in die bestmögliche Übereinstimmung bringt. Ich führe diese Anpassung durch Minimierung der Fehlerquadratabweichung der kumulativen Daten und nur für den ersten Teil des Zeitverlaufs durch. Letzteres tue ich, damit ich überprüfen kann, ob die Beziehung zwischen Testdaten und Sterbefällen im späteren Verlauf der Epidemie noch die gleiche ist, wie am Anfang. Wie wir sehen werden, kann man aus eventuellen Abweichungen mehr Information ziehen, als man nach dieser trockenen Beschreibung vielleicht erwartet.

Das war schon alles an Mathematik und fast alles an Beschreibung des Analyseverfahrens. Hinzufügen muss ich noch, welchen Teil der Daten ich für die Anpassung und damit die Parameterermittlung verwende. In Europa und Nordamerika verwende ich die Daten bis zum 119. Tag des Jahres, dem 28. April. Zu diesem Zeitpunkt war in den meisten europäischen Ländern und in den USA der Epidemiehöhepunkt bei den Sterbefällen klar überschritten. In Deutschland lag er eine Woche früher, am 21. April, in den USA am 22. April (gleitendes Wochenmittel). Für Südamerika passe ich bis zum 140. Tag des Jahres an, dem 19. Mai.

Italien als Archetyp der westeuropäischen Epidemiewelle

Die Methode ist am Beispiel Italiens in Abbildung 1 erläutert. Das linke Diagramm zeigt, dass die Sterbefallkurve tatsächlich wie erwartet gegenüber der Testzahlkurve verzögert ist und sonst eine ähnliche Form hat. Die Anpassung bis zum 28. April ergibt eine Verschiebung (englisch: shift) von 4,4 Tagen, eine Standardabweichung (englisch: standard deviation) von 3,1 Tagen und einen Anteil von 14,4% der Sterbefälle an den positiven SARS-Cov2-Tests (in der Abbildung als vertical scaling bezeichnet). Aus einer früheren Analyse von Übersterblichkeitsdaten hatte ich eine Verzögerung von 10-11 Tagen erwartet. Die Übersterblichkeitsdaten beruhen allerdings auf standesamtlichen Meldungen, also dem tatsächlichen Todestag, während die Covid-19-Daten Meldedaten sind. Eine Verzögerung von weniger als 11 Tagen ist daher als Meldeverzögerung zu interpretieren.

Das mittlere Diagramm zeigt, dass die Überlagerung nach der Faltung im Rahmen der Streuung der Daten fast perfekt ist. In den kumulativen Daten (rechtes Diagramm) erkennt man die verbleibenden Abweichungen besser. Allerdings habe ich schon für einfachere physikalische Probleme schlechter passende Modelle gesehen.

Daten von drei Kontinenten

Abbildung 2 zeigt Daten aus den Niederlanden, Kanada und Mexico. Für die Niederlande ist die Übereinstimmung in der (nicht angepassten) Schlussphase der Epidemie deutlich schlechter als für Italien. Die Ursache ist schnell ausgemacht. Während die Todesfallzahlen exponentiell gegen Null abfallen (dunkelblaue Punkte im linken oberen Diagramm), wie ich in früheren Modellanpassungen an Daten verschiedener Länder gezeigt habe, strebt die Zahl der positiven SARS-Cov2-Tests einen konstanten Basiswert an und verharrt auf diesem (magenta Punkte). Letzteres ist nicht plausibel und am einfachsten durch falsch positive Tests erklärbar. Ich nenne dieses Phänomen den Modus der ewigen Epidemie. Es hat diesem Blogpost den Titel gegeben. Mit solchen Testdaten kann man die Aufrechterhaltung von Maßnahmen und Empfehlungen rechtfertigen, die nach dem Ende der Epidemie – das die Sterbefallzahlen ausweisen – nicht zu rechtfertigen wären.

Kanada (mittleres Diagramm) weist einen anderen zeitlichen Verlauf auf, den ich in einem früheren Blogpost den angloamerikanischen Typ genannt hatte. Gleichwohl passt die Überlagerung mit dem Faltungsmodell fast so gut wie für Italien. Die Verzögerung beträgt hier 12 Tage, was bedeuten könnte, dass Kanada tatsächliche Sterbedaten meldet, die Standardabweichung nur 1,8 Tage. Man sollte die Variationen der Standardabweichung zwischen verschiedenen Ländern nicht überbewerten. Ich habe keine Fehleranalyse durchgeführt, vermute aber, dass dieser Parameter eine recht hohe Unsicherheit aufweist.

Für Mexiko (rechtes Diagramm) ist die Überlagerung praktisch perfekt. Allerdings ist hier der Anteil nicht angepasster Daten auch geringer und die Endphase der Epidemie ist bei Weitem noch nicht erreicht.

Der Sterbeüberhang in deutschsprachigen Ländern

Ein vom niederländischen Abweichungsmuster verschiedenes Abweichungsmuster findet man in den drei deutschsprachigen bzw. teilweise deutschsprachigen Ländern Europas – Deutschland, Österreich und Schweiz, aber auch fast nur in diesen und so ausgeprägt nur in diesen. Wie Abbildung 3 zeigt, ist in allen drei Ländern auf der abfallenden Seite der Epidemiewelle die Verzögerung der Sterbezahlkurve viel größer als auf der ansteigenden Seite. Das wäre erklärlich, wenn es inzwischen erhebliche, lebensverlängernde Therapiefortschritte gegeben hätte. Allgemeine Therapiefortschritte hätten den Effekt eines schnelleren Abfalls der Sterbezahlkurve, weil der Anteil versterbender Patienten abnehmen würde – wenn auch sicher nicht auf Null, wie die niederländischen Daten suggerieren würden.

Die Erklärung durch eine verbesserte Therapie ist aus zwei Gründen sehr unwahrscheinlich. Erstens hätten wir davon gehört und zweitens wäre sie nicht auf deutschsprachige Länder beschränkt. Wahrscheinlicher ist, dass diese Länder Sterbefälle anders Covid-19 zurechnen als andere Länder. Das Phänomen erklärt sich zwanglos, wenn in deutschsprachigen Ländern jeder Sterbefall Covid-19 zugerechnet wird, wenn der Verstorbene irgendwann einmal positiv auf SARS-Cov2 getestet worden war, unabhängig davon, ob die Infektionskrankheit inzwischen überwunden wurde. Die Zahl möglicher Fälle dieser Art nimmt im Lauf einer Epidemie zu.

Divergentes Verhalten – Großbritannien, die USA und Brasilien

Wir kommen jetzt zu den Datensätzen, die nicht plausibel sind. In Großbritannien (linkes Diagramm in Abbildung 4) ist direkt nach dem Epidemiehöhepunkt ein ähnliches Phänomen zu beobachten, wie in den Niederlanden am Epidemieende. Die Zahl der positiven Tests verharrt auf einem (nahezu) konstanten Niveau, während die Zahl der Todesfälle sehr deutlich abnimmt. Durch eine Veränderung der Meldeverzögerung ist das nicht erklärlich, denn diese betrug schon im angepassten Teil nur 4,1 Tage, während die Sterbezahlkurve nun 15-20 Tage eher abklingt als die Testzahlkurve. Was immer die Ursache sein mag, die Testzahlen aus Großbritannien sind ganz sicher keine valide Beschreibung des Epidemieverlaufs.

Das gleiche gilt, in noch stärkerem Ausmaß, für die USA (mittleres Diagramm). Hier divergieren die Testzahl- und die Todesfallkurve mit der Zeit immer stärker, bis zum heutigen Tag. Auch in den USA sagen die Testzahlen nichts Sinnvolles über den zeitlichen Verlauf der Epidemie aus. In den USA ist allerdings kaum erklärlich, wie das überhaupt zustande kommen kann. Eine Ausweitung der täglichen Testzahlen, die eine so starke Divergenz über so lange Zeit erzeugt, ist kaum vorstellbar. Das gilt umso mehr, als in den USA im weltweiten Vergleich auch in der Anfangsphase schon viel getestet wurde.

Das absurdeste Muster findet sich in Brasilien (rechtes Diagramm). Ausweislich der Sterbefallzahlen ist die Epidemie um den 24. Mai in eine Sättigungsphase übergegangen und vermutlich hat vor einigen Tagen die Abklingphase begonnen. In der Sättigungsphase hat sich die Zahl der positiven Tests zunächst fast linear vergrößert, auf mehr als den doppelten Wert zur Anfang der Sättigung der Sterbefallzahlen. Auch hier sind die Testzahlen völlig unrealistisch und schwerlich durch eine Ausweitung der Zahl täglich durchgeführter Tests zu erklären.

Der Fall Schweden

Die schwedischen Daten verdienen eine gesonderte Betrachtung. In Abbildung 5 habe ich zusätzlich als Vergleich die Daten aus Portugal aufgenommen – einem Land mit sehr ähnlicher Bevölkerungszahl und mit Test- und Sterbefallzahlen, die sich nur um einen Faktor von 1,5 bis 2,5 unterscheiden. Das ist beim Vergleich von Ländern in Bezug auf Covid-19 eine sehr kleine Spreizung.

Ich muss hier doch noch eine Bemerkung mathematischer bzw. statistischer Art machen: Man erwartet eine größere relative Streuung, wenn die Fallzahlen kleiner sind, also hier für Portugal (rechte Diagramme). Das Gegenteil ist der Fall und zwar in einem Ausmaß, das statistisch hoch signifikant ist – so signifikant, dass man nicht einmal eine formelle statistische Analyse braucht, um es zu sehen. Der Ausreißer ist Schweden, nicht Portugal. Es gibt kein zweites Land mit Fallzahlen in ähnlicher Größe wie in Schweden, dessen Daten auch nur annähernd so stark streuen.

Wenn die Daten der einzelnen Länder von Messinstrumenten ähnlicher Bauart kämen, würde ich schlussfolgern müssen, das das Messinstrument in Schweden defekt ist. In so einem Fall verwirft man die Daten. Das gilt in übertragenem Sinn auch für den Meldeprozess, aus dem die Daten tatsächlich stammen. Irgendetwas stimmt in Schweden nicht in diesem Meldeprozess. Aus den Daten lässt sich daher keine Aussage über irgendetwas ableiten. Das gilt in Schweden für Testzahlen und Sterbefälle gleichermaßen.

Schweden ist eins der reichsten und am höchsten entwickelten Länder der Welt. Es verfügt über im Allgemeinen sehr zuverlässige Institutionen. Angesichts der besonderen Strategie, welche die schwedische Regierung verfolgte, hatte diese ein besonderes Interesse an zuverlässigen Daten zum Epidemieverlauf, in noch stärkerem Maße als andere Regierungen. Das Schweden andere Daten gemeldet hat, als den Gesundheitsbehörden und der Regierung zur Verfügung standen, kann man ebenfalls mit sehr hoher Sicherheit ausschließen.

Das iberische Muster

Die Daten aus Portugal (rechte Diagramme in Abbildung 5) verdienen mehr Beachtung, als nur als ein Vergleichsbeispiel für Schweden. Auch hier sieht man einen Effekt wie in den Niederlanden, Großbritannien und den USA, aber hier mitten im Abfall der Epidemiewelle. Der Abfall der Zahl positiver Tests kommt zum Stillstand, sie beginnt sogar wieder leicht zu steigen. Für kurze Zeit verhält auch der Abfall der Sterbefälle, um sich dann aber bei weiter steigenden Testzahlen steil fortzusetzen. Er nähert sich der Nulllinie zum Schluss sogar schneller, als ein exponentielles Zerfallsmodel vermuten ließ. Für sich genommen wäre dieses Verhalten im Vergleich zu den bereits diskutierten Fällen nichts grundlegend Neues und Beachtenswertes. Betrachtet man aber auch noch das Nachbarland Spanien, ergibt sich doch etwas Erstaunliches. Ich rede deshalb vom iberischen Muster.

Die spanischen Daten haben mir am vergangenen Wochenende Sorgen bereitet. Der größte Teil der Sterbezahlkurve war ein Muster an Anpassbarkeit und Vorhersagbarkeit. Am Ende aber gab es einen Sprung. Eine Woche später ist nun klar, was hier geschehen ist.

Die Überlagerung von Testzahl- und Sterbefallkurve durch Faltung zeige ich deshalb in den linken Diagrammen in Abbildung 6 nur bis zum Tag 142, dem 21. Mai. Die Sterbefälle wachsen nach dem Anpassungsbereich etwas schneller als die Testzahlen. Dieser Effekt ist aber bis zum 21. Mai schwächer als in den deutschsprachigen Ländern.

Dann entgleisen die Daten, wie die rechten Diagramme zeigen. Zunächst gibt es vom 22.-26. Mai innerhalb von fünf Tagen drei unerwartet hohe Sterbefallzahlen, von denen diejenigen am 22. Und 26. Mai ganz sicher Ausreißer sind und diejenige am 25. Mai sehr wahrscheinlich auch. Es handelt sich hier nicht um eine einmalige Nachmeldung zuvor nicht gemeldeter Fälle, wie es sie in China und in geringerem Maße in einigen anderen Ländern gab. Das Phänomen ist eher von der Art wie das plötzliche Hochschnellen der Zahl positiver Tests in Tansania am 30. April, nur dass es sich bei Sterbefällen nicht durch verunreinigte Testkits erklären lässt.

Seit dem 27. Mai meldet Spanien sehr viel weniger Covid-19 zugeordnete Todesfälle und zwar in einem Maße, das auch mit der Kurve bis zum 21. Mai nicht konsistent ist. Bei einem oberflächlichen Blick auf das rechte obere Diagramm könnte man meinen, dass Spanien einfach gar keine Todesfälle mehr meldet. Zunächst waren die Zahlen aber sehr wohl noch größer als Null, wie das untere Diagramm zeigt. Offenbar wurde nur die Methodik geändert, nach der Sterbefälle Covid-19 zugeordnet werden. Das dürfte schwerlich auf Betreiben der Gesundheitsbehörden geschehen sein, sondern viel eher auf Betreiben der Regierung.

Ich kann dafür keinen innenpolitischen Grund erkennen. Eine Massenpanik war nicht zu erwarten. Die Öffnungen, die von der Regierung gerade geplant wurden, trafen in der Bevölkerung auf breite Zustimmung. Die Regierung muss aber einen sehr guten Grund für diese Änderung gehabt haben, denn sie birgt politischen Zündstoff und ist daher riskant.

Appylog

Der Schlussteil befasst sich mit einer scheinbar ganz anderen Frage, die in der vergangenen Woche in Deutschland und der Schweiz viel diskutiert wurde – der Corona-App. Die Idee ist, die Kontaktverfolgung zu automatisieren. Statt möglichen Kontakten hinterher zu telefonieren, definiert man einen Kontakt als längeren Aufenthalt in einem Bluetooth-Radius das Smartphones eine Person, die positiv auf SARS-Cov2 getestet wurde. Das Personal der Einrichtung, die den Test gemacht hat, generiert einen QR-Code. Dieser setzt die App auf dem Smartphone der getesteten Person in den Modus, in dem sie die Kontaktpersonen über deren Smartphone informiert.

Das Konzept überzeugt nicht wirklich. Man müsste sicher sein, dass die positiv getestete Person ihr Smartphone immer bei sich und immer Bluetooth eingeschaltet hatte und dass dasselbe für alle potentiellen Kontakte gilt. Hatte jemand das Ladekabel vergessen, muss man doch klassische Kontaktverfolgung betreiben - ganz davon abgesehen, dass man nie erreichen wird, dass 100% aller möglichen Kontakte die App betreiben. Wenn man aber doch klassische Kontaktverfolgung betreibt, ist das Ganze nur eine Spielerei. Oder auch nicht.

Im Vorfeld wurde viel über Datensicherheit diskutiert. Damit diese Art der Kontaktverfolgung überhaupt möglich ist, muss man nämlich eine Vorratsdatenspeicherung von Kontakten betreiben. Den meisten Regierungen war früh genug klar, dass die Apps nicht zu einem Zeitpunkt technisch reif sein würden, zu dem man der Bevölkerung noch eine zentrale Vorratsdatenspeicherung würde verkaufen können. Frankreich und Großbritannien haben anders gewettet und beide Regierungen haben ihre Wette verloren. Frankreich hat die App mit Vorratsdatenspeicherung bei Regierungsstellen tatsächlich in Umlauf gebracht, nur ist ihre Akzeptanz verschwindend gering. Großbritannien hat versucht, ein Konzept mit zentraler Vorratsdatenspeicherung mit Hilfe von Amazon und Google umzusetzen, die sich aber zurückgezogen haben. Vermutlich war ihnen das Geschäfts- und Reputationsrisiko zu groß, dass damit verbunden gewesen wäre, sich zum Komplizen eines solchen Vorhabens zu machen.

Anderswo werden die Vorratsdaten dezentral auf dem Smartphone gespeichert, wo sie sicher sind, sofern niemand das Smartphone hackt oder der Nutzer versehentlich ein Corona-App-Imitat eines Schurken heruntergeladen hat. Genauso wenig, wie man beweisen kann, dass ein nichttriviales Computerprogramm fehlerfrei ist, kann man ausschließen, dass etwas gehackt wird. Praktisch ist es so, dass alles gehackt werden kann, wenn die Angreifer hinreichend intelligent sind oder hinreichend große Ressourcen haben. Der Iran hat am 4. Dezember 2011 sogar eine US-Drohne (Lockheed Martin RQ-170) entführt, sicher auf eigenem Staatsgebiet gelandet und in der Folge in der Drohne gespeicherte Daten entschlüsselt und veröffentlicht.

Ein anderes Risiko ist ein Hack des Alarmierungssystems. Wenn das geschickt und in moderatem Ausmaß betrieben würde, könnte man damit ein Land vor der Aufdeckung nicht unerheblich schädigen – mal ganz abgesehen von der Schädigung der Einzelpersonen.

Das größte Missbrauchspotential benötigt allerdings gar kein Hack – zumindest nicht im engeren Sinne – und ist meines Wissens in der Öffentlichkeit gar nicht erwähnt worden. Ich diskutiere es an einem Beispiel, von dessen Art es noch mehrere gäbe.

Betrachten wir eine große Demonstration, bei der viele Teilnehmer ihr Smartphone eingeschaltet und die Corona-App darauf laufen haben. Nehmen wir an, dass diese Demonstration dem Inlandsgeheimdienst stark missfällt, was gelegentlich vorkommen soll. Wir dürfen davon ausgehen, dass dieser Geheimdienst eine größere Zahl von V-Leuten unter die Demonstranten gemischt hat.

Was denken Sie, wird in der Folge geschehen?

22:11 21.06.2020
Dieser Beitrag gibt die Meinung des Autors wieder, nicht notwendigerweise die der Redaktion des Freitag.
Geschrieben von

Gunnar Jeschke

Naturwissenschaftler, in der DDR aufgewachsen, gelebt in Schwarzheide, Dresden, Wako-shi (Japan), Bonn, Mainz, Konstanz und Zürich.
Gunnar Jeschke

Kommentare 187

Avatar
Ehemaliger Nutzer | Community
Avatar
Avatar
Avatar
Avatar
Avatar
Ehemaliger Nutzer | Community
Avatar
Avatar
Avatar
Avatar
Ehemaliger Nutzer | Community
Avatar
Avatar
Avatar
Avatar
Avatar
Avatar
Avatar
Avatar
Avatar
Avatar
Avatar
Avatar