Zulässige und unzulässige Vergleiche

Covid-19 Aus der Anzahl positiver SARS-Cov2-Tests kann man nicht auf die Schwere der Epidemie schließen
Bei diesem Beitrag handelt es sich um ein Blog aus der Freitag-Community

Wir haben uns inzwischen daran gewöhnt, dass Journalisten uns täglich mit der Zahl der positiv verlaufenen SARS-Cov2-Tests füttern und dass sie solche Zahlen verwenden, um Aussagen über die Schwere des Epidemieverlaufs in verschiedenen Ländern zu machen. In den meisten Fällen wird dabei nonchalant über die verschiedenen Bevölkerungzahlen der verglichenen Länder hinweggegangen. „Die USA sind weltweit am stärksten betroffen.“ Nein, das sind sie nicht. Bezogen auf die Bevölkerungszahl war zum Beispiel Spanien viel stärker betroffen.

Selbst wenn man auf die Bevölkerungszahl normiert, ist aber nicht klar, ob man aus dem Vergleich der Zahl der positiven Tests Rückschlüsse auf die Schwere der Epidemie in einem Land ziehen kann. Der wichtigste Grund für Zweifel sind die verschiedenen Testzahlen bezogen auf die Bevölkerungszahl. Wer mehr testet, erhält mehr positive Tests, was aber nicht bedeuten muss, dass mehr Krankenhausbetten belegt werden, mehr Menschen Intensivbehandlung benötigen und mehr Menschen sterben.

Vergleichen sollte man daher eher die Zahl der mit Covid-19 im Zusammenhang stehenden Todesfälle. Auch in diesem Fall ist allerdings nicht von vornherein klar, ob die relative Schwere der Epidemie in verschiedenen Ländern richtig wiedergegeben wird. Länder können verschiedene Regeln bei der Zuordnung von Todesfällen zu Covid-19 haben. Wo sehr wenig getestet wird, könnten Todesfälle nicht zugeordnet worden sein, bei denen ein Zusammenhang mit Covid-19 nicht offensichtlich war, während sie in anderen Ländern bei positivem SARS-Cov2-Test automatisch so zugeordnet werden. Und auch wenn es unpopulär ist, das zu sagen, macht es doch auch einen Unterschied, ob jemand durch eine Covid-19-Infektion zwei Tage, zwei Wochen, oder zwanzig Jahre eher gestorben ist, als er oder sie sonst gestorben wäre.

Den zuverlässigsten Vergleich erhält man mit Übersterblichkeiten, wie jeder gute Epidemiologe ohnehin weiß. Allerdings halten die meisten Staaten ihre detaillierten Sterbestatistiken unter Verschluss. Selbst an Organisationen wie EUROMOMO, die nur verarbeitete Daten veröffentlichen, aus denen viel weniger Rückschlüsse gezogen werden können, gibt nur ein kleiner Teil der europäischen Länder Daten ab. Zudem sind Übersterblichkeitsdaten selbst dort, wo sie verfügbar sind, viel später verfügbar. ES ist daher eine interessante Frage, wie unzuverlässig die Zahl positiver SARS-Cov2-Tests bzw. die Zahl der Covid-19 zugerechneten Sterbefälle sind, wenn man die Schwere eines Epidemieverlaufs einschätzen will.

Dieser Frage bin ich nachgegangen, indem ich die Daten von EUROMOMO mit den auf dem Offenen Datenportal der EU verfügbaren Daten zu positiven Tests und Sterbefällen korreliert habe. Die neuesten Bevölkerungszahlen habe ich aus einem Datensatz entnommen, der bei der Weltbank verfügbar ist. Für dieses Projekt war mir eine manuelle Digitalisierung der EUROMOMO-Daten mit Cursor und Eintippen zu stupid und zu aufwändig. Stattdessen habe ich die Abbildung als Portable Network Graphics heruntergeladen, wofür es ein Link gibt, und dann die blaue Linie im Bitmap mit einem kleinen selbstgeschriebenen Computerprogramm gesucht. Das ging schneller und war interessanter und vor allem kann ich in Zukunft neue Daten mit sehr geringem Aufwand einlesen. Die Daten für das Vereinigte Königreich habe ich vereinigt, indem ich sie mit dem jeweiligen Bevölkerungsanteil von England (84,3%), Wales (4,7%), Schottland (8,2%) und Nordirland (2,8%) gewichtet und addiert habe. Um eine Zahl für die Übersterblichkeit zu erhalten, habe ich die z-scores auf EUROMOMO für die Wochen 8 bis 20 gemittelt. Das deckt die Epidemie so weit ab, wie zuverlässige Daten vorhanden sind. Entsprechend habe ich auch die Covid-19 zugeordneten Todesfälle nur bis zum Ende der Woche 20 addiert. Bei den positiven SARS-Cov2-Tests habe ich nur bis 11 Tage vor dem Ende von Woche 20 addiert. Diese mittlere Zeitverschiebung zwischen Testdaten und Sterbefällen hatte ich bereits für einen früheren Blogpost ermittelt.

Die Korrelation zwischen den Covid-19 zugeordneten Sterbefällen und der tatsächlichen Übersterblichkeit ist nicht perfekt (Korrelationskoeffizient 0,844), aber brauchbar, wie das linke Diagramm zeigt. Deutlich unterschätzt wird die Übersterblichkeit im Vergleich zu anderen Ländern für Großbritannien und Spanien. Im ersten Fall kam das für mich nicht unerwartet. England hat, im Gegensatz zu anderen europäischen Ländern, eine signifikante Übersterblichkeit im Altersbereich unter 65 Jahren. Das Muster der Sterbefälle ist dort also anders und es ist plausibel, dass Sterbefälle sich umso stärker in der Übersterblichkeit bemerkbar machen, je stärker der Unterschied der Verstorbenen von der mittleren Lebenserwartung ist. Tatsächlich liegt bei Spanien die gleiche Ursache vor. Das war vor wenigen Wochen auf EUROMOMO noch nicht erkennbar, weil der gesante Altersbereich von 15-65 Jahren zusammengefasst wurde. Nun gibt es Daten für den Altersbereich 44-65 Jahre und in diesen zeigt sich auch in Spanien eine signifikante Übersterblichkeit. Warum die Übersterblichkeit für Belgien überschätzt wird, ist mir unklar.

Aus der Zahl positiver SARS-Cov2-Tests lässt sich dagegen keinerlei sinnvolle Vorhersage für die Übersterblichkeit ableiten (rechtes Diagramm). Eine Korrelation gibt es schon (Korrelationskoeffizient 0,430), aber auf diesem Niveau sind Vorhersagen und Vergleiche unbrauchbar. Deutlich wird das, wenn man beispielsweise Luxemburg mit Großbritannien vergleicht. Von allen verglichenen Ländern hat Luxemburg die höchste Zahl positiver SARS-Cov2-Tests pro Kopf der Bevölkerung. Sie ist fast doppelt so groß wie diejenige in Großbritannien. Gleichzeitig gibt es in Luxemburg keine signifikante Übersterblichkeit, während Großbritannien die höchste unter den verglichenen Ländern und wahrscheinlich die höchste weltweit aufweist. Die Zahl positiver SARS-Cov2-Tests hat ohne Normierung auf die Zahl der durchgeführten Tests keinerlei Aussagekraft, wie ich bereits in meinem ersten Covid-19-Blogpost bemerkt hatte. Paradoxerweise berufen sich gerade diejenigen, die mit diesen Zahlen operieren, darauf, das Problem auf wissenschaftlicher Grundlage zu betrachten. Nein Freunde, das tut Ihr eben nicht.

Zum Schluss habe ich noch überprüft, was die beiden Modelle für eine Übersterblichkeit für Deutschland vorhersagen, das ja zu EUROMOMO nicht beiträgt. Dass es in Deutschland insgesamt keine signifikante Übersterblichkeit durch Covid-19 gibt, ist bekannt. Es lässt sich auch an neueren Daten nachprüfen. Das Modell auf Basis der Covid-19 zugeordneten Sterbefälle sagt das auch vorher (grüne gepunktete Linie im linken Diagramm). Das Modell auf der Basis der Zahl der positiven SARS-Cov2-Tests hingegen sagt einen doppelten so hohen Wert voraus, der nun signifikant ist (er liegt im rechten Diagramm leicht oberhalb der roten gepunkteten Linie, die ich genauso einzeichne wie die Forscher bei EUROMOMO).

Meine nächste Hypothese wäre, dass man Übersterblichkeiten etwa 11 Tage eher vorhersagen könnte, wenn man normierte Testdaten hätte, also den Anteil positiv verlaufener Tests. Diese Hypothese kann ich nicht überprüfen, weil solche Daten meines Wissens nur für den Schweizer Kanton Genf vorliegen, für den es aber keine Übersterblichkeitsdaten gibt. Ich kann aber jedenfalls keinen wissenschaftlichen Grund erkennen, warum Institutionen wie das Robert Koch Institut weiterhin nur die Zahl positiver Tests aber nicht deren Anteil bekanntgeben. Sie erzeugen damit Information, die für eine Analyse des Epidemieverlaufs unbrauchbar ist.

22:36 30.05.2020
Dieser Beitrag gibt die Meinung des Autors wieder, nicht notwendigerweise die der Redaktion des Freitag.
Geschrieben von

Gunnar Jeschke

Naturwissenschaftler, in der DDR aufgewachsen, gelebt in Schwarzheide, Dresden, Wako-shi (Japan), Bonn, Mainz, Konstanz und Zürich.
Gunnar Jeschke

Kommentare 183