Statistiek, stoeien met een aanname van het aantal patiënten

Om te beginnen: mijn aanname van twee weken voor de benadering van het aantal mensen dat op dit moment (nog) corona heeft, is er eentje die op drijfzand is gebaseerd. Geen idee of het klopt. Het levert echter wel interessante grafieken op.

Hierboven de situatie in China tussen 4 februari en nu.

De oranje lijn geeft zoals ook eerder de procenten toename van nieuw positief getesten, ten opzichte van het totaal van dat moment. De blauwe lijn is mijn benadering van het percentage toe- of afname het huidige aantal patiënten, en dit op basis van de aanname dat 95% van de mensen in elk geval na 14 dagen van COVID-19 af is.

Je ziet in de oranje grafiek een sprongetje, dat was toen ze in China een andere manier van registreren gingen gebruiken. Die piek zie je twee weken later heel groot terug in de blauwe grafiek van het aantal patiënten.

Je ziet in de blauwe lijn dat het aangenomen aantal patiënten afneemt tot ruim twee weken geleden, waarna het weer toeneemt, en vervolgens naar nul gaat.

Dat is wel ongeveer zoals ik het zou verwachten. Wat echter de onzekerheid is, dat is wanneer gaat de lijn écht door nul. Het kan zowel zijn dat ik bij de hele lijn één of twee of misschien vijf of tien procent moet optellen, als dat ik er een dergelijk aantal moet aftrekken. Over die 14 dagen zijn veel deskundigen het echter wel eens, dus er is ook een kans dat het gewoon heel aardig klopt.

De grafiek hierboven is van Zuid-Korea over dezelfde periode als die van China, 4 februari tot 5 april. Oranje is weer het percentage toename ten opzichte van het totaal die dag, de blauwe lijn de aanname van het totale aantal mensen dat nog patiënt is op die dag, en daar dan het percentage stijging of daling van ten opzichte van de dag ervoor.

Wat heel goed duidelijk is dat is dat het absolute aantal patiënten schommelt en niet scherp daalt. De toename daalt wel, maar wat ook zou moeten is dat het aantal patiënten van dat moment omlaag moet. In Zuid-Korea is dat wel gedurende anderhalve week zo geweest, en daar voor ook een keer, maar dan korter en in de periode dat er nog heel weinig patiënten waren, maar daarna is het ook opnieuw weer opgelopen. Dat zie je niet terug in de toename van het totaal, maar wel in het aantal mensen dat nog ziek is.

De oorzaak van dat verschil is dat het percentage van een groot aantal (dat de ziekte gehad heeft of nog heeft) een laag percentage is. Maar als het totale aantal groot is, over de hele periode, dan gaat het toch nog over een flink getal. Het aantal mensen dat het heeft neemt af. Daardoor zijn variaties over dat kleine aantal veel significanter dan over het totale aantal.

Lockdown in 1918

In de onderstaande grafiek kun je goed de uitwerking van en lockdown zien. Het zijn de statiestieken van twee Amerikaanse steden tijdens de dramatisch verlopen Spaanse griep van 1918. Turkoois van kleur is de stad St. Louis, die al na twee dagen een lockdown instelde. De magenta (paarsachtig) gekleurde statistiek is van Philadelphia, waar pas na twee weken de beschermende maatregelen van kracht werden.

Wat je ziet is dat er in Philadelphia vijf maal zoveel doden waren te betreuren dan in St. Louis. Ook zie je dat de stijgende grafiek in de plaats met de meeste doden pas inzette, nadat de maatregelen ook daar van kacht werden, en in St. Louis zelfs nog anderhalve week later.

Ook opmerkelijk is dat in Philadelphia (late maatregelen) de epidemie na twee maanden al na twee maanden uitgeraasd was, en dat dat in St. Louis na 2,5 maand.

Betere cijfers…

Ik ben nog steeds bezig met de statistiek.

Ik ben tevreden met hoe het percentage toename de uitwerking van de maatregelen als social distancing en partiële lockdown laten zien.

Echter: wat ik eigenlijk graag zou willen zien is hoeveel mensen er op dit moment nog corona hebben. In het begin werden cijfers gepubliceerd van mensen die in Wuhan van COVID-19 hersteld waren. Dat gebeurt echter niet meer. De vraag is ook, mocht ik ze alsnog voor de huidige situatie tegenkomen, hoe betrouwbaar zijn die gegevens in verhouding tot de cijfers van nieuwe besmettingen?

Denkend hierover kwam ik op het volgende. Misschien is het wel een goede benadering van het getal als ik kijk naar hoe lang het duurt voordat patiënten hersteld zijn.

Bijna alle bronnen zeggen dat na uiterlijk 14 dagen 95% van de mensen van het virus hersteld is. Dat zijn mensen die er nauwelijks wat van merken, en mensen die er toch flink ziek van zijn, maar voor wie geen ziekenhuisopname nodig is.

Het zou dus voor een ruwe benadering nauwkeurig genoeg kunnen zijn als je kijkt naar hoeveel mensen 14 dagen geleden positief getest waren. Dat is wat ik voor een nieuw percentagecijfer doe.

Ik reken nu steeds uit, hoeveel procent de toename van vandaag is, ten opzichte van het totaal van vandaag. (En dat alles over positief getesten).

Vervolgens doe ik dezelfde berekening nogmaals. Maar dan niet met het totaal van vandaag, maar het totaal van vandaag, verminderd met het totaal aantal van 14 dagen geleden.

Wat je dan overhoudt is een ruwe benadering van het totaal aantal mensen dat nu nog COVID-19 heeft. Het percentage dat je daarmee krijgt, zegt iets over of het totaal aantal patiënten van nu toe of afneemt.

Dat percentage valt uiteraard hoger uit dan zonder correctie voor het aantal herstelden. Wanneer dit getal beduidend lager is dan 0, dan is het zeker dat het aantal patiënten afneemt, en dat de epidemie dus op zijn retour is.

Hieronder allereerst de grafiek zoals ik tot nu toe maakte, zonder correctie, het gaat over de 21 dagen van 16 maart t/m 5 april:

Hieronder de grafiek van de ruwe benadering van het aantal mensen dat nu ziek is, ook weer  over de 21 dagen van 16 maart t/m 5 april, de grafiek is grotendeels gelijk, vooral in het begin, maar ligt iets hoger:

Hieronder de grafiek met beide curves, opnieuw over de 21 dagen van 16 maart t/m 5 april. De laagste is de ongecorrigeerde statistiek. Als het percentage toename steeds blijft dalen, zul je zien dat de afstand tussen de beide statistieken in deze grafiek steeds groter zal worden. Wanneer de oranje curve (die met de correctie) flink onder 0% komt is het zeker dat de epidemie afneemt:

Daling

De daling in het precentage aantallen nieuwe mensen dat positief getest is voor COVID-19 lijkt zich gisteren te hebben doorgezet. We zitten in elk geval op een niveau van zo’n 50% lager dan een week geleden. De maatregelen lijken te werken.

Waarden voor de afgelopen week:

13,71 13,62 11,87 10,16 7,52 6,71 7,48

Bovenstaande grafiek is van de afgelopen 3 weken. De eerste dag van de grafiek was 13 maart, de dag dat er voor het eerst een andere manier van registreren werd gebruikt.

Het is normaal dat de grafiek tijdens het verloop afvlakt. De huidige sterkere daling zette al rond dag 10 van deze grafiek in, maar stagneerde twee dagen later weer. Vanaf dag 16 zette de daling echter opnieuw in.

Het is jammer dat ik geen betrouwbare gegevens voor het aantal genezen mensen heb kunnen vinden tot nu toe. Met dat getal en het aantal overledenen kun je het huidige aantal patiënten uitrekenen. Aan dat getal kun je goed zien of het huidige aantal patiënten toe- of afneemt.

Opmerkelijke cijfers

De statistieken (volgens WHO) voor Nederland laten de afgelopen dagen een opmerkelijke daling zien. Links is een week geleden, rechts is het cijfer voor gisteren. Het betreft het toename van het aantal nieuw positief geteste personen voor COVID-19 in procenten voor de dag ervoor.

13,29 13,71 13,62 11,87 10,16 7,52 6,71

De week ervoor zagen de cijfers er als volgt uit:

16,92 16,63 17,84 17,54 13,63 11,48 14,59

Het lijkt een opmerkelijke daling, maar voorzichtigheid is geboden. Reuze spannend wat het getal dat vandaag bekend gemaakt wordt zal zijn.

Meer statistiek over drie landen

Dit keer statistieken die het verloop van de hele epidemie in een land laten zien. Eerst China. Registratie door WHO begon daar op 21 januari.

China

De grote piek in het schema is rond 17 februari, toen China overschakelde op een andere manier van registreren.

Italië

De epidemie begon in Italië op 24 januari, maar bleef toen voortdurend laag, in een maand tijd kwamen er intotaal drie positief geteste personen bij. Dat veranderde op 22 februari toen het aantal van 6 naar 9 ging, en een dag later naar 76. Daarna ging de groei gestaag naar beneden. De nationale lockdown in Italië ging in op 9 maart, dat is bij het getal 40 in de grafiek. Het effectzou je na 55 in de grafiek moeten zien.

Op 21 februari (33 in de grafiek) werd er al een lockdown in een aantal plaatsen in het noorden van kracht, en op 27 februari (39 in de grafiek) werden die op checkpoints bewaakt en dicht gehouden. Het effect van die eerste lockdowns is in de grafiek heel goed te zien.

Zuid-Korea

Zuid-Korea is een land dat ervaring heeft met de eerdere SARS-uitbraak. Het begin lijkt op de situatie in Italië. Bij het begin dat WHO deze cijfers ging bijhoudenlwas er 1 patiënt geregistreerd. Dat was op 21 januari.

Op 30 januari had Zuid-Korea 4 positief geteste personen, een dag later waren dat er 11. Vanaf 19 februari ging het hard. Op 29 februari 3150 positief getesten, met in de week ervoor20 tot 25% toename. Op 1 maart ging de stijging naar 15%. Een week later was dat 5,14%. Vanaf 12 maart zit het percentage stijging onder de 1,5%. Alleen op 20 maart piekte het een keer naar 2,76%, maar op 18 maart was het eenmalig 0%, dus misschien was het een inhaalslag. (Net rechts van 57 in de grafiek).

Zuid-Korea gaat heel ver om dit te bereiken. Testen op het virus werd gecombineerd met een intensieve contactopsporing.

Het beleid bestaat eruit dat geïnfecteerde Zuid-Koreanen verplicht in een opvangscentrum van de overheid in quarantaine moeten gaan. Hun telefoons en creditcardgegevens worden gebruikt om hun eerdere bewegingen te traceren en de mensen te vinden met wie ze in contact zijn geweest. Degenen van wie is vastgesteld dat ze in de buurt van de geïnfecteerde persoon zijn geweest, ontvangen telefonische meldingen met informatie over waar ze zich eerder hebben bevonden.

Volgens Chun Byung-Chul, een epidemioloog aan de Korea University, krijgen risicopatiënten met onderliggende ziekten voorrang bij ziekenhuisopname. Patiënten met matige symptomen worden naar ‘herbestemde bedrijfsopleidingsfaciliteiten en ruimtes van openbare instellingen’ gestuurd, waar ze observatie en medische ondersteuning krijgen. Patiënten die herstellen en tweemaal negatief getest worden, worden weer vrijgelaten.

Mensen die nauw contact met patiënten hebben gehad en geïnfecteerde personen met minimale symptomen die hun eigen temperatuur kunnen meten, en van wie de gezinsleden vrij zijn van chronische ziekten, moeten zichzelf gedurende twee weken in quarantaine plaatsen. Lokale monitoringteams bellen de quarantaine tweemaal per dag om ervoor te zorgen dat deze mensen blijven waar ze zijn en om te vragen naar symptomen.

Degenen die verplicht zijn om in zelfquarantaine te verblijven, moeten een app downloaden die ambtenaren waarschuwt als de patiënt zich buiten de quarantaine begeeft. Overtreders krijgen een boete van maximaal US $ 2.500.

(tekst over de aanpak van Zuid-Korea is deels gebaseerd op Wikipedia)

Aangepaste statistieken

Ik heb geprobeerd wat te doen aan de grillige statistieken van bijvoorbeeld de VS en van de linkerhelft van de statistieken voor bijv. België en Turkije. Je ziet deze grilligheid vaker aan het begin van de epidemie in een land. Waarschijnlijk worden de gegevens nog niet goed verzameld, of ongelijktijdig aangeleverd.

Middelen van een waarde met de dag ervoor levert geen echt bevredigende resultaten op. Middelen met de waarde van de dag ervoor en de dag erna levert iets betere resultaten op.

De grafiek van de VS zonder bewerking (boven) en met middeling van drie dagen (deze grafiek begint en eindigt begrijpelijkerwijs een dag eerder dan de andere grafiek.

USA van 13 maart tot 29 maart zonder aanpassing

USA van 12 maart tot 28 maart met middeling voor drie dagen

Stille getuigen

Met het blote oog vanuit mijn huis niet te lezen, en lastig zelfs om te zien dat er wat staat. Het is het kinderdagverblijf bij mij in de straat. Ik vind de foto zo tekenend voor de huidige situatie.

“Eigen” coronacijfers

SInds ongeveer 1 maart hoiud ik de statistieken bij op basis van de cijfers van de rapportages die WHO iedere dag doet uitgaan.

Ik let daarbij uitsluitend op het percentage nieuwe coronapatiënten.Ik denk dat dat een goede graadmeter is. Niet de absolute getallen, want die getallen groeien iedere dag omdat ook het totale aantal groeit. Door de procenten te nemen zie je een getal dat iedere dag gelijk is, het groeit niet met het toename van het totale aantal.

De grafieken hieronder zijn voor de dagen van 13 t/m 29 maart. Vanaf die datum waren de Nederlandse cijfers uit de eerste hoge getallen, die door meerdere oorzakenkunnen komen, bijvoorbeeld door onregelmatig aanleveren vantestresultaten.

Nederland, percentages toenamen nieuw positief geteste personen per dag. Links 13 maart, rechts 29 maart, en langs de verticale lijn van beneden naar boven de procenten.

Nederland

Italië

Verenigde Staten

België

Turkije

Spanje