Statistiek, stoeien met een aanname van het aantal patiënten

Om te beginnen: mijn aanname van twee weken voor de benadering van het aantal mensen dat op dit moment (nog) corona heeft, is er eentje die op drijfzand is gebaseerd. Geen idee of het klopt. Het levert echter wel interessante grafieken op.

Hierboven de situatie in China tussen 4 februari en nu.

De oranje lijn geeft zoals ook eerder de procenten toename van nieuw positief getesten, ten opzichte van het totaal van dat moment. De blauwe lijn is mijn benadering van het percentage toe- of afname het huidige aantal patiënten, en dit op basis van de aanname dat 95% van de mensen in elk geval na 14 dagen van COVID-19 af is.

Je ziet in de oranje grafiek een sprongetje, dat was toen ze in China een andere manier van registreren gingen gebruiken. Die piek zie je twee weken later heel groot terug in de blauwe grafiek van het aantal patiënten.

Je ziet in de blauwe lijn dat het aangenomen aantal patiënten afneemt tot ruim twee weken geleden, waarna het weer toeneemt, en vervolgens naar nul gaat.

Dat is wel ongeveer zoals ik het zou verwachten. Wat echter de onzekerheid is, dat is wanneer gaat de lijn écht door nul. Het kan zowel zijn dat ik bij de hele lijn één of twee of misschien vijf of tien procent moet optellen, als dat ik er een dergelijk aantal moet aftrekken. Over die 14 dagen zijn veel deskundigen het echter wel eens, dus er is ook een kans dat het gewoon heel aardig klopt.

De grafiek hierboven is van Zuid-Korea over dezelfde periode als die van China, 4 februari tot 5 april. Oranje is weer het percentage toename ten opzichte van het totaal die dag, de blauwe lijn de aanname van het totale aantal mensen dat nog patiënt is op die dag, en daar dan het percentage stijging of daling van ten opzichte van de dag ervoor.

Wat heel goed duidelijk is dat is dat het absolute aantal patiënten schommelt en niet scherp daalt. De toename daalt wel, maar wat ook zou moeten is dat het aantal patiënten van dat moment omlaag moet. In Zuid-Korea is dat wel gedurende anderhalve week zo geweest, en daar voor ook een keer, maar dan korter en in de periode dat er nog heel weinig patiënten waren, maar daarna is het ook opnieuw weer opgelopen. Dat zie je niet terug in de toename van het totaal, maar wel in het aantal mensen dat nog ziek is.

De oorzaak van dat verschil is dat het percentage van een groot aantal (dat de ziekte gehad heeft of nog heeft) een laag percentage is. Maar als het totale aantal groot is, over de hele periode, dan gaat het toch nog over een flink getal. Het aantal mensen dat het heeft neemt af. Daardoor zijn variaties over dat kleine aantal veel significanter dan over het totale aantal.

Lockdown in 1918

In de onderstaande grafiek kun je goed de uitwerking van en lockdown zien. Het zijn de statiestieken van twee Amerikaanse steden tijdens de dramatisch verlopen Spaanse griep van 1918. Turkoois van kleur is de stad St. Louis, die al na twee dagen een lockdown instelde. De magenta (paarsachtig) gekleurde statistiek is van Philadelphia, waar pas na twee weken de beschermende maatregelen van kracht werden.

Wat je ziet is dat er in Philadelphia vijf maal zoveel doden waren te betreuren dan in St. Louis. Ook zie je dat de stijgende grafiek in de plaats met de meeste doden pas inzette, nadat de maatregelen ook daar van kacht werden, en in St. Louis zelfs nog anderhalve week later.

Ook opmerkelijk is dat in Philadelphia (late maatregelen) de epidemie na twee maanden al na twee maanden uitgeraasd was, en dat dat in St. Louis na 2,5 maand.

Betere cijfers…

Ik ben nog steeds bezig met de statistiek.

Ik ben tevreden met hoe het percentage toename de uitwerking van de maatregelen als social distancing en partiële lockdown laten zien.

Echter: wat ik eigenlijk graag zou willen zien is hoeveel mensen er op dit moment nog corona hebben. In het begin werden cijfers gepubliceerd van mensen die in Wuhan van COVID-19 hersteld waren. Dat gebeurt echter niet meer. De vraag is ook, mocht ik ze alsnog voor de huidige situatie tegenkomen, hoe betrouwbaar zijn die gegevens in verhouding tot de cijfers van nieuwe besmettingen?

Denkend hierover kwam ik op het volgende. Misschien is het wel een goede benadering van het getal als ik kijk naar hoe lang het duurt voordat patiënten hersteld zijn.

Bijna alle bronnen zeggen dat na uiterlijk 14 dagen 95% van de mensen van het virus hersteld is. Dat zijn mensen die er nauwelijks wat van merken, en mensen die er toch flink ziek van zijn, maar voor wie geen ziekenhuisopname nodig is.

Het zou dus voor een ruwe benadering nauwkeurig genoeg kunnen zijn als je kijkt naar hoeveel mensen 14 dagen geleden positief getest waren. Dat is wat ik voor een nieuw percentagecijfer doe.

Ik reken nu steeds uit, hoeveel procent de toename van vandaag is, ten opzichte van het totaal van vandaag. (En dat alles over positief getesten).

Vervolgens doe ik dezelfde berekening nogmaals. Maar dan niet met het totaal van vandaag, maar het totaal van vandaag, verminderd met het totaal aantal van 14 dagen geleden.

Wat je dan overhoudt is een ruwe benadering van het totaal aantal mensen dat nu nog COVID-19 heeft. Het percentage dat je daarmee krijgt, zegt iets over of het totaal aantal patiënten van nu toe of afneemt.

Dat percentage valt uiteraard hoger uit dan zonder correctie voor het aantal herstelden. Wanneer dit getal beduidend lager is dan 0, dan is het zeker dat het aantal patiënten afneemt, en dat de epidemie dus op zijn retour is.

Hieronder allereerst de grafiek zoals ik tot nu toe maakte, zonder correctie, het gaat over de 21 dagen van 16 maart t/m 5 april:

Hieronder de grafiek van de ruwe benadering van het aantal mensen dat nu ziek is, ook weer  over de 21 dagen van 16 maart t/m 5 april, de grafiek is grotendeels gelijk, vooral in het begin, maar ligt iets hoger:

Hieronder de grafiek met beide curves, opnieuw over de 21 dagen van 16 maart t/m 5 april. De laagste is de ongecorrigeerde statistiek. Als het percentage toename steeds blijft dalen, zul je zien dat de afstand tussen de beide statistieken in deze grafiek steeds groter zal worden. Wanneer de oranje curve (die met de correctie) flink onder 0% komt is het zeker dat de epidemie afneemt: