Statistiek, stoeien met een aanname van het aantal patiënten

Om te beginnen: mijn aanname van twee weken voor de benadering van het aantal mensen dat op dit moment (nog) corona heeft, is er eentje die op drijfzand is gebaseerd. Geen idee of het klopt. Het levert echter wel interessante grafieken op.

Hierboven de situatie in China tussen 4 februari en nu.

De oranje lijn geeft zoals ook eerder de procenten toename van nieuw positief getesten, ten opzichte van het totaal van dat moment. De blauwe lijn is mijn benadering van het percentage toe- of afname het huidige aantal patiënten, en dit op basis van de aanname dat 95% van de mensen in elk geval na 14 dagen van COVID-19 af is.

Je ziet in de oranje grafiek een sprongetje, dat was toen ze in China een andere manier van registreren gingen gebruiken. Die piek zie je twee weken later heel groot terug in de blauwe grafiek van het aantal patiënten.

Je ziet in de blauwe lijn dat het aangenomen aantal patiënten afneemt tot ruim twee weken geleden, waarna het weer toeneemt, en vervolgens naar nul gaat.

Dat is wel ongeveer zoals ik het zou verwachten. Wat echter de onzekerheid is, dat is wanneer gaat de lijn écht door nul. Het kan zowel zijn dat ik bij de hele lijn één of twee of misschien vijf of tien procent moet optellen, als dat ik er een dergelijk aantal moet aftrekken. Over die 14 dagen zijn veel deskundigen het echter wel eens, dus er is ook een kans dat het gewoon heel aardig klopt.

De grafiek hierboven is van Zuid-Korea over dezelfde periode als die van China, 4 februari tot 5 april. Oranje is weer het percentage toename ten opzichte van het totaal die dag, de blauwe lijn de aanname van het totale aantal mensen dat nog patiënt is op die dag, en daar dan het percentage stijging of daling van ten opzichte van de dag ervoor.

Wat heel goed duidelijk is dat is dat het absolute aantal patiënten schommelt en niet scherp daalt. De toename daalt wel, maar wat ook zou moeten is dat het aantal patiënten van dat moment omlaag moet. In Zuid-Korea is dat wel gedurende anderhalve week zo geweest, en daar voor ook een keer, maar dan korter en in de periode dat er nog heel weinig patiënten waren, maar daarna is het ook opnieuw weer opgelopen. Dat zie je niet terug in de toename van het totaal, maar wel in het aantal mensen dat nog ziek is.

De oorzaak van dat verschil is dat het percentage van een groot aantal (dat de ziekte gehad heeft of nog heeft) een laag percentage is. Maar als het totale aantal groot is, over de hele periode, dan gaat het toch nog over een flink getal. Het aantal mensen dat het heeft neemt af. Daardoor zijn variaties over dat kleine aantal veel significanter dan over het totale aantal.