E pluribus unum

Covid-19 Staatliche Zwangsmaßnahmen hatten keinen Einfluss auf den zeitlichen Verlauf der Epidemie.
Bei diesem Beitrag handelt es sich um ein Blog aus der Freitag-Community

Die Epidemie verzögern?

Die meisten von uns werden irgendeine Form der Infografik gesehen haben, die zum Anfang der Corona-Krise im Umlauf war und die ich hier einem Spiegel-Artikel von Nina Hentzen vom 11. März entnommen habe. Sie wurde zur Begründung der geplanten „social distancing“-Maßnahmen benutzt. Nach dieser Grafik sollten die Maßnahmen erreichen, dass sich der Anstieg der Infektionszahlen verlangsamt, der Höhepunkt der Epidemie dadurch verzögert und gleichzeitig die Zahl gleichzeitig infizierter Personen an diesem Höhepunkt verringert wird. Nur damit wiederum, so wurde uns erklärt, ließe sich eine Überlastung des Gesundheitswesens am Höhepunkt vermeiden, die anderenfalls wegen des in der ersten Infografik des Artikels nahegelegten exponentiellen Anstiegs unvermeidlich eintreten würde.

Mir selbst ist diese Grafik erstmals am 5. März in meiner eigenen Institution begegnet, als Handzeichnung. Mir erschien sie damals auch einleuchtend. Geht man allerdings den im Spiegel-Artikel angegebenen Quellen nach, so findet man in der ursprünglichen Quelle, einem Dokument des European Centre for Disease Prevention and Control (ECDC), die Abbildungsbeschreibung „Illustration der Ziele des social distancing“. Das legt nahe, dass es sich hier nur um eine Wunschvorstellung handelt, nicht um eine belegte Wirkung. Tatsächlich hat eine von der WHO in Auftrag gegebene Studie untersucht, ob es wissenschaftliche Evidenz für eine solche Wirkung gibt. Wie ich an anderer Stelle bereits erläutert habe, ist diese Studie zu dem Schluss gekommen, dass die Evidenz für eine solche Wirkung schwach ist und die Autoren haben von der Anwendung drastischer Maßnahmen abgeraten. In ihrem in der Zeitschrift Emerging Infectious Diseases (EID) erschienenen der Artikel gibt es als einzige Abbildung auch eine Form dieser Infografik. Die zweite Datenquelle, die der Spiegel angibt ist EID und bezieht sich sehr wahrscheinlich auf diese Grafik. Die Beschreibung „Beabsichtigte Wirkung von social-distancing-Maßnahmen“ ist noch vorsichtiger als diejenige im ECDC-Dokument. Im Spiegel-Artikel heißt es dagegen: „Wie Maßnahmen den Verlauf der Epidemie beeinflussen“. Aus einer Ziel- oder Wunschvorstellung ist die Behauptung geworden, dass die Wirkung solcher Maßnahmen bekannt und belegt sei. Ein sehr netter Kommentator könnte das als journalistische Sorglosigkeit bezeichnen. Ein etwas weniger netter Kommentator würde von Irreführung der Öffentlichkeit reden, weil er annähme, dass eine Spiegel-Journalistin Englisch verstehend lesen kann und sich im Rahmen ihrer Recherche zumindest eines der beiden Originale angesehen hat.

Unter den Medienikonen, die sich im Laufe der Krise herausgebildet haben, ist diese Grafik nicht. Dafür gibt es zwei Gründe. Erstens geht die Grafik implizit von der Annahme aus, dass die Epidemie erst dann abklänge, wenn eine Herdenimmunität erreich werde. Deshalb sind die Flächen unter beiden Kurven in neueren Versionen auch etwa gleich. In der ersten Märzhälfte wurde sogar explizit so argumentiert, hinauf bis zur Bundeskanzlerin Angela Merkel, die vorhersagte, dass sich zwei Drittel der Bevölkerung infizieren werden. Diese Abschätzung beruhte auf der für Covid-19 angenommenen Basisreproduktionszahl von 3. Inzwischen ist der Höhepunkt der Epidemiewelle klar überschritten – darauf komme ich zurück – und niemand geht davon aus, dass auch nur annähernd Herdenimmunität erreicht wurde – auch darauf komme ich zurück. Zweitens wurde damals zumindest anfangs behauptet, die Maßnahmen würden den Höhepunkt bis in den Sommer verschieben. Er wurde aber bereits Mitte April überschritten.

Das Narrativ hat sich daher geändert. Jetzt wird behauptet, die Maßnahmen hätten eine schnelle Eindämmung der Epidemie erreicht, in offensichtlichem Widerspruch zu den Zielvorstellungen, die WHO und ECDC propagiert hatten. Es könnte doch aber immerhin sein, dass die Maßnahmen den Epidemieverlauf etwas verzögert und das Abklingen der Welle beschleunigt hätten. Ob das der Fall ist, werde ich in diesem Blogpost untersuchen.

Der Nobelpreisträger Michael Levitt behauptet dazu, dass eine Covid-19-Epidemiewelle immer das gleiche mathematische Verhalten zeige, starkes Wachstum für etwa zwei Wochen, sehr bald eine subexponentielle Phase und dann einen Abfall. Seinen Nobelpreis erhielt er 2013 auf dem Gebiet der Chemie, immerhin aber für die Entwicklung von Multiskalenmodellen für komplexe chemische Systeme. Man darf annehmen, dass er weiß, was man aus Daten schließen kann und worauf man achten muss. Dennoch nehme ich auch einem Nobelpreisträger nichts ungeprüft ab, zumal der Beitrag keine Daten zeigt. Levitts Hypothese besteht zumindest eine erste Plausibilitätsprüfung: Die Mortalitätsdaten von EUROMOMO zeigen für alle Länder, bei denen es überhaupt Auffälligkeiten gibt, ein Verhalten, das mindestens grob seiner Beschreibung entspricht. Im Folgenden prüfe ich, ob das auch im Detail gilt und wenn ja, mit welcher Genauigkeit.

Überschussmortalitäten und Epidemieverlauf

Warum verwende ich gerade die Überschussmortalitäten für den Test der Hypothese? Es handelt sich dabei um den zuverlässigsten Datensatz für eine ausreichende Zahl von Ländern, der mir zugänglich ist. Wie ich an anderer Stelle argumentiert habe, kann man aus der Zahl positiver Covid-19-Tests keine zuverlässigen Aussagen über den zeitlichen Verlauf der Epidemie ableiten, wenn man nicht außerdem die zugehörigen Zahlen der insgesamt durchgeführten Tests hat. Diese werden aber fast nirgends mit der gleichen zeitlichen Auflösung und Genauigkeit publiziert wie die Anzahl positiver Tests. Ich habe nur einen sehr guten Datensatz, der aus dem Schweizer Kanton Genf stammt. Diesen werde ich nach der Analyse der Überschussmortalitäten mit dem Zeitverlauf der Mortalitäten vergleichen.

Auch die Zahl der Todesfälle mit positivem Covid-19-Test lässt keine zuverlässige Aussage über den zeitlichen Verlauf der Epidemie zu und zwar aus dem gleichen Grund. Wie viele Todesfälle man so zuordnet, hängt davon ab, wie viel man testet. Ändert sich die Testintensität zeitlich, was praktisch überall der Fall war, wird der zeitliche Verlauf der Epidemie verzerrt.

Bei den Überschussmortalitäten ist das nicht der Fall. Niemand bezweifelt ernsthaft, dass die im März und April in einigen europäischen Ländern beobachteten Überschussmortalitäten weitestgehend durch Covid-19-Infektionen bedingt sind. So makaber es klingen mag, in den Statistiken über Todesfälle gibt es keine „Testlücken“, höchstens Verzögerungen. EUROMOMO korrigiert diese Verzögerungen so gut wie möglich. Natürlich sind die Todesfälle gegenüber den Neuinfektionen prinzipiell verzögert, aber man erwartet, dass diese Zeitverschiebung in allen Ländern die gleiche ist. Hier liegen Daten vor, auf deren Basis man den Epidemieverlauf in verschiedenen Ländern sehr genau vergleichen kann. Der einzige Nachteil ist, dass die Zeitauflösung nur eine Woche beträgt.

Anhand der für die einzelnen Länder dargestellten z-score-Daten auf EUROMOMO kann man drei Ländergruppen identifizieren. In der ersten Gruppe ist keinerlei signifikante Überschussmortalität durch Covid-19 zu beobachten. Zu dieser Gruppe von elf Ländern gehören Dänemark, Estland, Finnland, Griechenland, Irland, Luxemburg, Malta, Norwegen, Österreich, Portugal und Ungarn. Auch Deutschland, das nicht als gesamtes Land Daten an EUROMOMO meldet, ist dieser Gruppe als zwölftes Land zuzurechnen, wie ich vor einer Woche gezeigt habe. Die zweite Gruppe zeigt eine um das Maximum nahezu symmetrische Epidemiewelle. Zu ihr gehören Belgien, Frankreich, Italien, die Niederlande, Spanien, Schweden und die Schweiz. Eine genauere Analyse zeigt, dass es in den Altersgruppen von 0-4 Jahren und 5-14 Jahren in überhaupt keinem Land eine signifikante Übersterblichkeit gibt und in der Altersgruppe von 15-64 Jahren knapp signifikante Übersterblichkeiten in Italien und den Niederlanden und deutlichere Effekte in Belgien, Frankreich und Spanien. Auch in den letztgenannten drei Ländern ist diese Altersgruppe aber immer noch deutlich weniger betroffen als die über 65jährigen. Abgesehen davon zeigen alle sieben Länder der zweiten Gruppe ein ähnliches Muster. Dieser Gruppe wären aus dem Vereinigten Königreich, das auch nicht gesamthaft dargestellt wird, auch noch Wales, Schottland und Nordirland zuzurechnen, die ich in der weiteren Analyse allerdings nicht weiter beachten werde. Die dritte Gruppe besteht ausschließlich aus England. Dort erscheint der Abfall der Epidemiewelle ab zwei Wochen nach dem Maximum bisher deutlich langsamer zu sein. Außerdem ist die Übersterblichkeit in der Gruppe der 15-64-jährigen dort deutlich höher als in allen anderen Ländern. England beziehe ich in meine Analyse ein, so dass ich acht Länder vergleiche.

In der linken Hälfte der ersten Abbildung sind die z-score-Daten der acht Länder so dargestellt, wie auf EUROMOMO, nur gemeinsam. Solche z-scores werden berechnet, indem die Zahl der überschüssigen Todesfälle durch die Standardabweichung der Zahl der Todesfälle geteilt wird. Etwas genauer und mit Grafiken werde ich das Verfahren weiter unten anhand der deutschen Daten für das Jahr 2018 erklären. Der z-score zeigt, wie ernst das Problem in einem Land ist. Aus den in den Medien immer wieder vorgebrachten absoluten Todesfallzahlen kann nicht darauf geschlossen werden, weil diese weder auf die Bevölkerungszahl noch auf die natürlichen Schwankungen der Sterblichkeit normiert sind.

Zu sehen ist, dass die Epidemiewellen in den acht Ländern zeitlich gegeneinander verschoben sind und unterschiedlich hohe Maxima haben. Um den zeitlichen Verlauf vergleichen zu können, muss man diese beiden Effekte kompensieren. Als Referenzdatensatz verwende ich dazu die Daten Spaniens, das unter den Ländern der zweiten Gruppe am stärksten betroffen ist. Optimiert habe ich die zeitliche Verschiebung und die vertikale Skalierung für die Wochen 8 bis 16, wobei ich auch Verschiebungen um Bruchteile einer Woche zugelassen habe. Dazu habe ich Punkte zwischen den existierenden Datenpunkten mit formerhaltender stückweiser kubischer Spline-Interpolation berechnet. Für England hat die Epidemiewelle erst reichlich eine Woche nach der spanischen ihr Maximum erreicht. Zudem zeigt sie ein anderes Abfallverhalten. Deshalb habe ich die englischen Daten nur für die Wochen 8 bis 15 angepasst.

Das Ergebnis in der rechten Hälfte der ersten Abbildung stützt die These von Michael Levitt, dass der zeitliche Verlauf in allen Ländern gleich ist. Ich werde das unten noch in übersichtlicherer Form zeigen. Dieser Teil der Abbildung zeigt auch die zeitlichen Verschiebungen. Nur in Italien wurde die Epidemiewelle früher als in Spanien beobachtet und zwar um etwa drei Tage. Am spätesten trat die Welle in Schweden auf, reichlich neun Tage später als in Spanien. Um eine allgemeine Masterkurve zu erhalten, habe ich den Mittelwert der acht so überlagerten Kurven berechnet.

Testdaten und Überschussmortalität

Wenn das zeitliche Verhalten wirklich universell ist, wie Michael Levitt behauptet, so sollte auch der Anteil positiver Covid-19-Tests an allen durchgeführten Tests überall dieses Verhalten zeigen. Anders dürfte das nur sein, wenn während der Epidemie die Teststrategie deutlich verändert wurde, also große Gruppen mit anderem Infektionsrisiko zunächst nicht, dann aber doch getestet wurden. Damit kann ich Levitts These einem noch strengeren Test unterziehen, indem ich die Genfer Testdaten, die zusammen mit anderen Schweizer Daten auf Github offen zugänglich sind, mit der Masterkurve überlagere. Wiederum brauche ich nur eine zeitliche Verschiebung und eine vertikale Skalierung anzupassen. Das Ergebnis ist in der zweiten Abbildung gezeigt. In einer wissenschaftlichen Publikation wäre es unvornehm, das Folgende zu sagen, aber in einem Blogpost darf ich: Die Übereinstimmung ist unverschämt gut. Ich darf das vor allem deshalb sagen, weil die eigentliche Entdeckung nicht von mir gemacht wurde. Ich stehe auf den Schultern eines Nobelpreisträgers. Was ich auch sagen darf ist, dass die These von Michael Levitt damit unabhängig bestätigt worden ist, und zwar an Daten, die zumindest in dem Beitrag auf Unherd nicht erwähnt werden.

Genfer Testdaten sagen den zeitlichen Anstieg der Übersterblichkeit in acht Ländern vorher

Dass der Epidemieverlauf universell ist und durch ordentlich normierten Testdaten richtig erfasst wird, ist nicht unwichtig. Auch das Folgende ist makaber, aber zutreffend: Wenn man die Kurve der Überschussmortalität sehen kann, ist es bereits zu spät. Die Genfer Testdaten wiesen ihr Maximum 7,3 Tage vor der spanischen Referenzkurve aus und ganze 10 Tage vor der Überschussmortalität in der Schweiz.

Da alle Wellen der Überschussmortalität sich recht gut übereinanderlegen lassen und der Verlauf der Genfer Testdaten sich sehr gut mit der Masterkurve überlagert, mag es trivial erscheinen, die Genfer Testdaten mit den Kurven der einzelnen Länder zu überlagern. In einer wissenschaftlichen Publikation müsste ich die entsprechende Abbildung deshalb in das Ergänzungsmaterial verbannen, oder ich hätte das mit der vorherigen Abbildung tun müssen. In einem Blogpost jedoch bin ich mein eigener Herr.

Um diese Diagramme zu erhalten, musste ich keine nochmalige numerische Anpassung durchführen. Die zeitlichen Verschiebungen der Länderkurven (schwarz) und der Genfer Testkurve (rot) gegen die spanischen Referenzdaten kenne ich bereits. Auch die Maxima der Länderkurven, die ich zur vertikalen Skalierung benötige, kenne ich. Wer genau hinsieht, wird erkennen, dass die Genfer Testkurve (rot) in jedem Teildiagramm etwas anders aussieht. Das kommt daher, dass die zeitlichen Verschiebungen keine ganzen Wochen sind und ich, wie oben beschrieben, interpoliere. Dabei beobachte ich, dass diese formerhaltende Interpolation die Genfer Testdaten den Überschussmortalitätskurven der Länder anschmiegt. Das ist nicht selbstverständlich, sondern spricht für die Robustheit des universellen Zeitverhaltens der Epidemie.

Signifikante Abweichungen sind nur im abfallenden Teil der Epidemiewellen von Belgien, Frankreich, der Schweiz und Englands zu sehen. Für die Fälle Belgien und Frankreich ist eine Verzögerung bei der Meldung der Sterbefälle die wahrscheinlichste Erklärung. Die letzten beiden Datenpunkte auf EUROMOMO ändern sich häufig bei Updates in den Folgewochen noch einmal. Von den restlichen beiden Fällen zeigt die Schweiz ein schnelleres und England ein langsameres Abklingen der Übersterblichkeit. Die wahrscheinlichste Ursache dafür ist der Umgang des Gesundheitssystems mit Covid-19-Erkrankungen. Es ist denkbar, dass in der Schweiz im Laufe der Zeit zu einer vorteilhafteren und in England zu einer weniger vorteilhaften Behandlungspraxis übergegangen wurde. So etwas ist bei einer neuen Krankheit nicht unerwartet. Man notwendigerweise experimentieren, um die optimale Behandlung zu finden und kann dabei Glück oder Pech haben. Ob tatsächlich eine Veränderung der Praxis im Gesundheitswesen die Unterschiede erklärt, könnte aber nur eine entsprechende Studie zeigen.

Diese Anpassung der Testdaten könnte man bei möglichen zukünftigen Epidemiewellen relativ früh machen, wenn man wie im Kanton Genf grundsätzlich nicht nur die Zahl der positiven Tests, sondern auch die Gesamtzahl meldet. Ich kann keine anderen als politisch-propagandistische Gründe sehen, warum man das nicht tun würde. Natürlich gibt es keine Garantie, dass eine zweite Welle dem gleichen zeitlichen Verlauf folgen würde wie die erste. Das von Levitt gefundene universelle Verhalten der ersten Welle hat aber dennoch potentiell die beste Vorhersagekraft aller bisher aufgestellten Modelle.

Vergleich mit der Influenza-Welle 2018 in Deutschland

Wie universell ist das Zeitverhalten beliebiger Epidemien? Diese Frage ist schon deshalb wichtig, weil in der kommenden Wintersaison auch ein anderes Corona-Virus in Umlauf gelangen könnte. Zunächst einmal erwartet man nicht, dass die These auf beliebige Viruserkrankungen übertragbar ist. Wenn das der Fall wäre, wäre dieses Verhalten lange vor Levitt entdeckt worden. Richtig ist allerdings, dass Epidemiewellen niemals sehr lange exponentiell ansteigen und dass Epidemien in der Regel abflauen weit bevor Herdenimmunität erreicht wird. Die in der ersten Märzhälfte im Allgemeinen und in dem eingangs erwähnten Spiegel-Artikel im Besonderen vorgebrachten Behauptungen waren auch damals weder fundiert noch plausibel.

Als Beispiel zeige ich Daten der Influenza-Welle 2018 im gleichen Format, was mir auch Gelegenheit bietet, die Methodik etwas näher zu erläutern, die den z-scores zugrunde liegt. Dazu habe ich die täglichen Sterbedaten des Jahres 2018 analysiert, die auf Destatis (Statistisches Bundesamt) zugänglich sind. Das linke Diagramm zeigt die Originaldaten und das, was bei EUROMOMO als Detrending und Desaisoning bezeichnet wird. Dazu habe ich Regionen außerhalb von Übersterblichkeitswellen per Augenschein identifiziert und eine gemeinsame Anpassung eines Polynoms dritten Grades an diese Datensegmente durchgeführt (blaue Linien). Mit diesem Polynom habe ich die Basislinie unter den Übersterblichkeitswellen abgeschätzt. Nach dem Abziehen des Polynoms im gesamten Bereich haben die Daten eine flache Basislinie (mittleres Diagramm, blaue gestrichelte Linie). Wiederum nur für den „blauen Bereich“ habe ich die Standardabweichung der Punkte berechnet und die Fallzahlen durch diese Standardabweichung dividiert, um z-scores zu erhalten. Bereiche, die oberhalb der dreifachen Standardabweichung (gestrichelte rote Linie) liegen, entsprechen einer starken Übersterblichkeit. Zum Schluss habe ich die z-scores jeweils für eine Woche gemittelt (rechtes Diagramm), um das auf EUROMOMO verwendete Format zu erhalten. Ich bin sicher, dass sie das bei EUROMOMO noch sorgfältiger machen, aber für die folgenden Diskussionen und Vergleiche genügt dieses einfache Verfahren.

Zunächst bemerkt man neben der Grippewelle mit einem maximalen Wochen-z-score von etwa 12 eine zweite Übersterblichkeitswelle Ende Juli-Anfang August mit einem maximalen Wochen-z-score von etwa 6. Zu dieser Zeit gab es in Deutschland eine Hitzewelle. Ich hoffe, dass ich mit dieser Beobachtung unsere Politiker nicht dazu anrege, bei der nächsten Hitzewelle einen Lockdown zu verhängen, damit sich die Leute nicht überanstrengen und dadurch zu Tode kommen.

Des Weiteren kann man die vertikal skalierte Influenzawelle (grau gestrichelt) mit der Masterkurve der Covid-19-Epidemie vergleichen. Das zeitliche Verhalten unterscheidet sich, aber nicht extrem. Der Anstieg der Covid-19-Welle ist nicht um ein Mehrfaches schneller als derjenige der Influenza-Welle 2018 in Deutschland. Der Covid-19-Anstieg ist sogar „weniger exponentiell“. Er startet recht unvermittelt, steigt aber nach sehr kurzer Zeit nur noch linear an. Die Influenzawelle zeigt hingegen exponentielles Anfangsverhalten – ihr Anstieg nimmt eine geraume Zeit erst einmal zu.

Fazit

„E pluribus unum“ ist das bekanntere der beiden Gründungsmotti der USA, wo es auf Münzen geprägt wird. Es bedeutet „Aus vielen eines“. Hier habe ich, einer Entdeckung von Michael Levitt folgend, viele Datensätze auf ein Muster zurückgeführt. Dieses universelle Muster ist unvereinbar mit der Annahme, dass drastische „social distancing“-Maßnahmen den Covid-19-Epidemieverlauf beeinflussen. Die acht Länder, die das gleiche zeitliche Verhalten aufweisen, schließen auf der einen Seite das liberale Schweden und auf der anderen Seite die extrem restriktiven Staaten Italien, Spanien und Frankreich ein. Zudem haben die restriktiveren unter den acht Staaten ihre Zwangsmaßnahmen zu verschiedenen Zeitpunkten im Epidemieverlauf eingeführt. Das ließe sich auch im Detail belegen, da das universelle Zeitverhalten eine universelle Zeitachse einführt, auf der sich die Maßnahmen eintragen lassen. Hätten diese Maßnahmen das Infektionsgeschehen signifikant beeinflusst, so müsste man das in den hier analysierten Daten sehen. Für die Aufrechterhaltung solcher Maßnahmen oder ihre Wiedereinführung in der Zukunft mag es politische Gründe geben. Wissenschaftlich fundierte Gründe gibt es dafür nicht.

Alle Abbildungen wurden mit MATLAB-Skripten aus den jeweiligen Originaldaten erzeugt. Daten von EUROMOMO wurden digitalisiert, indem die einzelnen Punkte mit dem Mauszeiger angefahren wurden. Die Daten werden dann angezeigt. Daten aus der Destatis-Excel-Datei wurden aus Excel als comma-separated values abgespeichert und Kommentarzeilen wurden entfernt. Die Genfer Daten wurden aus der Datei COVID19_Fallzahlen_CH_total_v2.csv auf openZH/covid_19 extrahiert. Alle Datensätze und MATLAB-Skripte sind auf Anfrage vom Autor erhältlich.

23:28 09.05.2020
Dieser Beitrag gibt die Meinung des Autors wieder, nicht notwendigerweise die der Redaktion des Freitag.
Geschrieben von

Gunnar Jeschke

Naturwissenschaftler, in der DDR aufgewachsen, gelebt in Schwarzheide, Dresden, Wako-shi (Japan), Bonn, Mainz, Konstanz und Zürich.
Gunnar Jeschke

Kommentare 229

Avatar
Ehemaliger Nutzer | Community
Avatar
Ehemaliger Nutzer | Community
Avatar
Avatar
Avatar
Avatar
Avatar
Avatar
Avatar
Avatar
Avatar
Avatar
Ehemaliger Nutzer | Community
Avatar
Avatar
Avatar
Ehemaliger Nutzer | Community
Avatar
Avatar
Avatar
Avatar
Der Kommentar wurde versteckt
Der Kommentar wurde versteckt
Avatar
Avatar
Avatar
Ehemaliger Nutzer | Community
Avatar
Avatar
Avatar
Avatar
Avatar
Avatar
Ehemaliger Nutzer | Community
Avatar
Avatar
Ehemaliger Nutzer | Community
Avatar
Avatar
Avatar
Avatar
Avatar
Avatar
Avatar
Avatar
Avatar
Avatar
Avatar
Ehemaliger Nutzer | Community
Avatar