Meteen naar de inhoud

Schatting van de oversterfte in Nederland in 2021

[geplaatst op 11-1-2022; 3500 woorden; leestijd 15 minuten]
  1. INLEIDING

    In de media wordt regelmatig gediscussieerd over de oversterfte, en worden ideeën geponeerd over de oorzaak van die oversterfte. Kandidaten zijn natuurlijk in de eerste plaats COVID, maar mogelijk spelen ook de vaccinaties en/of de uitgestelde zorg en/of preventiemaatregelen een rol.
    Bij deze discussie is altijd het vertrekpunt de sterfte zoals die door het CBS werd verwacht. We kunnen immers pas iets zeggen over oversterfte, als we een idee hebben hoeveel sterfte we ‘normaal’ achten.

    Een typische grafiek waarin de verwachte sterfte en de gemeten sterfte samen worden afgebeeld is de onderstaande. De lichtblauwe baan rondom de onderste lijn geeft aan wat de marges zijn voor de ‘normale’ of ‘verwachte’ sterfte. Overal waar de donkerblauwe lijn boven de lichtblauwe band ligt is er sprake van oversterfte.
  1. VERANDERING IN WIJZE VAN BEREKENEN

    In een eerder artikel heb ik aandacht besteed aan de wijze waarop het CBS tot zijn schatting van de sterfte komt. Twee dingen vielen me daarbij op:
    1. Het CBS maakt een correctie voor de 'meest waarschijnlijke ontwikkelingen in de bevolking en de sterfte', maar ze geeft niet aan hoe ze deze correctie berekent.
    2. Het model dat het CBS gebruikt lijkt slecht gekalibreerd, want door de jaren heen is er vrijwel altijd sprake van oversterfte en vrijwel nooit van ondersterfte, terwijl je toch zou verwachten dat die twee elkaar in evenwicht houden. Dit duidt erop dat het CBS structureel weinig doden verwacht, en daarom snel concludeert tot oversterfte.

    Inmiddels heb ik de plaats gevonden waar het CBS uitlegt hoe het corrigeert voor vergrijzing.
    Men heeft, als reactie op de COVID-epidemie, per 2 oktober 2020 de rekenwijze voor het berekenen van de verwachte sterfte aangepast, en de nieuwe rekenwijze met terugwerkende kracht toegepast op heel 2020.
    Op basis de waargenomen sterfte in de jaren 2015-2019 wordt het verwachte aantal overledenen geschat als er geen corona-epidemie was geweest.
    (...) Eerst wordt voor elk jaar de sterfte per week bepaald. Vervolgens wordt per week een gemiddelde van de sterfte in die week en de zes omliggende weken bepaald. Deze gemiddelde sterfte per week levert een benadering van de verwachte wekelijkse sterfte, er is namelijk nog geen rekening gehouden met de trendmatige vergrijzing van de bevolking. Daarom is de sterfte per week nog herschaald naar de verwachte totale sterfte voor het jaar.(cursivering BO) Voor 2020 is dit 153 402 en voor 2021 is dit 154 887. Het aantal voor 2020 is ontleend aan de Kernprognose 2019-2060 en het aantal voor 2021 aan de Bevolkingsprognose 2020-2070 (exclusief de aanname van extra sterfgevallen door de corona-epidemie). De marges rond de verwachte sterfte zijn geschat op basis van de waargenomen spreiding in de sterfte per week in dezelfde vijf jaar. Deze methode is met terugwerkende kracht toegepast op de verwachte sterfte vanaf week 1 in 2020. (...)
    Het rapport waar men zich voor 2020 op baseert, dateert van december 2019, en is vanaf hier te downloaden.
    De waarde 153.402 wordt niet in het rapport genoemd. Ook wordt niet uitgelegd hoe men tot dit getal komt. [noot 1] Het is niet te achterhalen hoe deze waarde tot stand is gekomen, daarom probeer ik een zo eenvoudig mogelijke reconstructie te maken die een beetje in de buurt komt.

    De genoemde waarde voor de totale sterfte ligt heel dicht bij een lineaire extrapolatie van de sterftecijfers over de voorgaande jaren: over de jaren vanaf 2009 waren er gemiddeld ieder jaar 1765 doden meer, en als die trend zich zou doorzetten, verwachten ze voor 2020 een aantal doden van (151.885 + 1765 =) 153.650. Dat zit redelijk dicht op het aangehaalde getal van 153.402. [noot 2]

    Voor zo’n kernprognose is schatten op basis van een gemiddelde uit voorgaande jaren een normale werkwijze: de werkelijke waarde kan ieder individueel jaar (fors) afwijken van het gemiddelde, maar het betreft hier een lange-termijn prognose, en dan is de redelijke verwachting dat afwijkingen elkaar opheffen.
    Voor het bepalen van de sterfte van een individueel jaar is deze werkwijze niet gepermitteerd, omdat
    1. De afwijkingen van het gemiddelde groot kunnen zijn: in 2015 overleden er 6146 mensen meer dan dit gemiddelde; in 2014 overleden er 3787 mensen minder dan dit gemiddelde. Daaruit blijkt dat dit getal nauwelijks een voorspellende waarde heeft voor een individueel jaar. De marge is zeker plus of min 4000.
    2. Er is altijd de tendens dat er na een jaar met ondersterfte een jaar met oversterfte volgt en vice versa. Aangezien 2019 een vrij aanzienlijke ondersterfte had ligt het in de lijn om voor 2020 juist een hogere sterfte te verwachten. In plaats daarvan bouwt men door op de relatief lage sterfte van 2019. Dit alleen al zal leiden naar een onderschatting. [noot 3]
    3. De methode van het gemiddelde is erg grof, en er zijn genuanceerdere data beschikbaar. Op basis van de gepubliceerde CBS-data berekende ik als verwachte sterfte in 2020 een totaal van 158.173.[noot 4] Het verschil iks dus bijna 5000, en dat is een aanzienlijk.
    4. Het is ongebruikelijk en onwenselijk om je methode van beschrijven en voorspellen halverwege de rit aan te passen aan de gewijzigde omstandigheden. Dit maakt het lastig tot onmogelijk om de voorspellingen van verschillende jaren onderling te vergelijken.
    5. Het doel van de exercitie is om te bepalen hoeveel sterfte je in de toekomst kunt verwachten. Bij het bepalen van je verwachting kun je je curve schalen voor verschillende factoren, zoals bevolkingsgroei, veranderende leeftijdsopbouw of voor toegenomen levensverwachting. Daaraan kun je conclusies verbinden voor de verwachten sterfte. Maar dit werkt natuurlijk niet meer op het moment dat je de hele grafiek eerst schaalt naar je ‘verwachte aantal overlijdens’. In dat geval heb je de einduitkomst al van tevoren bepaald, en kun je het alleen nog maar over de verdeling hebben. Kortom: je hebt je vraag niet beantwoord, je hebt simpelweg je antwoord geponeerd.


  2. STERFTE in 2020 en 2021

    Bekijken we de sterfte die het CBS verwacht had voor 2021.

    Opnieuw is dit niet de sterfte zoals die op basis van de gepubliceerde gegevens te berekenen valt, maar de sterfte zoals die zou zijn geweest als er geen epidemie was geweest.
    Men verwijst opnieuw naar een andere studie die een voorspelling doet voor de langere termijn.
    Voor 2021 wordt een totale sterfte van 154.887 verwacht. Wederom is dit getal niet als concreet cijfer in het rapport terug te vinden. Dit cijfer ligt (154.887 – 153.402 = ) 1485 hoger dan de verwachte sterfte voor 2020. Feitelijk zet men de extrapolatie van het vorige jaar door – met alle eventuele vertekeningen die daarbij horen.

    Het CBS vermeldt dat dit de prognose is exclusief de aanname van extra sterfgevallen door de corona-epidemie. Met andere woorden: men doet de voorspelling voor het aantal sterfgevallen in 2021 zoals die zou zijn als er in 2020 geen corona was geweest:
    (...) Het verwachte aantal overledenen wanneer er geen corona-epidemie was geweest, is geschat op basis van het aantal overledenen in de voorafgaande weken, gecorrigeerd voor seizoensgebonden factoren. (...)
    Maar als je de keuze maakt om te voorspellen wat er gebeurd zou zijn zonder de corona-epidemie, terwijl die er natuurlijk wel was, dan maak je geen optimale, laat staan een realistische voorspelling van het aantal sterfgevallen voor het komende jaar.

    Het is interessant om te bekijken wat het verschil is tussen een normale voorspellingen en de voorspellingen zoals het CBS die heeft gedaan. Om de tekst niet te belasten, heb ik de gegevens van het CBS die ik gebruik en het hele excel-sheet met alle berekeningen opgenomen op een aparte pagina.
    In het bijzonder van belang zijn de bladen ‘voorspelde mortaliteit’ waar ik mijn berekening van de verwachte sterfte deel, het blad ‘sterfte data’ waar (uitgesplitst naar weeknummer en cohort) de data van het CBS met betrekking tot sterfte zijn bijeengebracht, en het blad ‘oversterfte volgens CBS’, waar per week de actuele sterfte naast de voorspelde sterfte wordt geplaatst. [noot 5]

    Voor 2020 had het CBS voor de totale bevolking (na correctie voor weersomstandigheden) de verwachting dat er 154.379 mensen zouden overlijden, en dat bleken er 168.678 te zijn.
    Daarmee bedraagt de oversterfte 14.299. (zie blad: oversterfte volgens CBS).
    Die 168.678 gemeten sterfte valt uiteen in:
    0 – 65 jaar 21.683
    65 – 80 jaar 51.529
    80+ 95.736
    Mijn eigen berekening van de verwachte sterfte, op basis van de data t/m 31 december 2019 plus de samenstelling van bevolking op 1 januari 2020 luidde:
    65 – 80 jaar 48.059
    80+ 89.114
    De vergelijking van mijn verwachting en de geconstateerde sterfte in deze twee groepen samen levert een oversterfte van in totaal ((51529 + 95736) - (48059 + 89114) = ) 10.092. [noot 6] Het verschil in oversterfte tussen mijn verwachting versus die van het CBS ten gevolge van een verschillende rekenwijze bedraagt voor 2021 dus (14.299- 10.092 = ) 4207 mensen.


    Hetzelfde kunnen we doen voor 2021:
    Voor 2021 had het CBS, voor de totale bevolking de verwachting dat er 155.473 mensen zouden overlijden, en dat bleken er 170.546 te zijn. Daarmee bedraagt de oversterfte volgens het CBS 15.073.
    Die 170.546 gemeten sterfte valt uiteen in
    0 – 65 jaar 22.540
    65 – 80 jaar 52.721
    80+ 94.570

    Mijn eigen berekening van de verwachte sterfte, op basis van de data t/m 31 december 2020 plus de samenstelling van bevolking op 1 januari 2021 luidde:
    65 – 80 jaar 50.410
    80+ 92.074
    De oversterfte in deze twee groepen samen bedroeg dus in mijn berekening 4807.

    Het verschil in oversterfte tussen mijn verwachting versus die van het CBS ten gevolge van een verschillende rekenwijze bedraagt voor 2021 dus (15.073- 4807 = ) 10.266 mensen (sic!).


    Bij het CBS is er dus voor beide jaren een aanzienlijk verschil tussen de voorspelde sterfte en de gemeten sterfte, 14.300 resp 15.000. Dit verschil (= de oversterfte) wordt toegeschreven aan COVID.
    Normaal, als er een groot verschil is tussen de voorspelling en de uitkomst zijn er twee mogelijkheden: ofwel er is iets heel ernstigs aan de hand, ofwel de voorspelling was niet goed. Normaal vertrouwen we erop dat de voorspellingen van het CBS goed zijn, maar in dit geval is de kwaliteit van de voorspelling laag. Dat blijkt uit het feit dat, op basis van exact dezelfde gegevens, er een veel betere voorspelling te doen was, i.e. een voorspelling die beter overeenkomt met de werkelijkheid zoals die zich naderhand heeft ontvouwd.
    Daarbij is ook precies aan te wijzen waarom het CBS zo’n slechte voorspelling doet: men geeft niet weer wat men verwacht dat er gebeurt, maar men houdt vast aan wat er gebeurd zou zijn als er geen COVID epidemie was geweest. Dat is echt iets anders.

    De keus om de waargenomen sterfte af te zetten tegen een fictieve werkelijkheid is een politieke keuze, een poging om te bepalen hoeveel (extra) doden het gevolg zijn van de epidemie. Daarmee krijgt de epidemie een aparte status – dit soort bewerkingen voeren we niet uit voor griepepidemieën, hittegolven of migratiegolven. Daarmee treedt het CBS buiten haar veld van de beschrijvende statistiek: uit de cijfers sec is immers nooit op te maken waaraan een sterfgeval moet worden toegeschreven.


    Het is me niet duidelijk wat het CBS denkt te bewijzen met deze enorme oversterfte. In 2020 is er volgens het CBS een aantal van 14.300 mensen dat extra overlijdt t.g.v. een epidemie waar op dat moment nog geen vaccin tegen bekend is. Het volgende jaar wordt een groot deel van de bevolking gevaccineerd met een nieuw vaccin – en het resultaat is een nog grotere oversterfte, nl. 15.000. Het lijkt mij dat je daarmee op zijn best aantoont dat de effectiviteit van het vaccin gering is, dat het loslaten van verschillende quarantaine-achtige maatregelen de werking van het vaccin volkomen teniet doet, of dat de nieuwe varianten volledig compenseren voor de vaccinaties. Ik denk dat dat allemaal niet is wat je op dit moment als overheid wilt uitdragen – en het is ook geen goede beschrijving van de werkelijkheid. Het is een artefact, enkel het gevolg van de keuzes die je hebt gemaakt voor je wijze van berekenen.

    Overigens is het volstrekt legitiem als het CBS een schatting wil maken van ‘hoeveel mensen er zouden zijn overleden als er geen COVID was geweest'. Alleen zou zij dit naast de reguliere voorspelling moeten doen, en niet in plaats van.
    Een dergelijke schatting is op verschillende manieren te maken.
    Voor 2020 geldt: als men de voorspelling van de sterfte baseert op de ontwikkelingen t/m 2019, dan is de voorspelling sowieso ‘zonder COVID’. Mijn uiteindelijke schatting voor de oversterfte kwam in het vorige artikel op 10.450. Het is redelijk om het grootste deel van deze oversterfte toe te schrijven aan COVID en aan de gevolgen van de maatregelen die genomen zijn om deze ziekte te bestrijden.

    Als ik voor een fictief 2021 (dus zonder COVID) gebruik maak van de sterfte/overlevingskansen per cohort van het jaar daarvoor (dus zoals die golden voor 2020) en dat toepas op de samenstelling van de bevolking per 1 januari 2021, dan kom ik voor dat jaar op een verwachte sterfte van
    65 – 80 jaar 49.501
    80+ 90.236
    De oversterfte in deze twee groepen samen bedraagt dan ((52721 + 94570) - (49501 + 90236) = )7554. Deze oversterfte kan worden toegeschreven aan COVID. [noot 7] De oversterfte die ik voor 2021 toeschrijf aan COVID (7554) is nog altijd maar de helft van het aantal dat het CBS daaraan toeschrijft (15.073).


  1. CONCLUSIE

    Ik kan alleen maar concluderen dat het CBS – tegen alle goede gewoontes in – een politiek gekleurde keuze heeft gemaakt door haar rekenwijze aan te passen, waarbij het aantal doden dat wordt toegeschreven aan COVID enorm wordt uitvergroot, ten koste van de kwaliteit van de voorspelling. Daartoe worden cijfers uit andere studies gebruikt, cijfers die niet te controleren zijn, cijfers waarmee een extreem laag aantal doden wordt geanticipeerd voor 2020 en 2021.

    Dat is geen naïviteit – de mensen bij het CBS zijn niet dom of gek. Als ik uit hun cijfers tot een betere voorspelling kan komen, kunnen zij dat ook – en beter. E.e.a. blijkt uit de volgende passage uit het 2de rapport dat ze gebruiken, de prognose 2020 – 2070. Dit is gepubliceerd op 16-12 – 2020, dus toen de 1ste golf al volledig was gepasseerd, en de 2de in volle gang was.
    (...) De sterftekansen voor 2020-2022 zijn aangepast, rekening houdend met de hogere sterfte vanwege het nieuwe coronavirus. De aannames hebben betrekking op het aantal mensen dat op jaarbasis overlijdt bovenop wat het model verwacht voor dat jaar. Dit aantal is lager dan het aantal mensen dat op basis van de doodsoorzakenstatistiek aan corona overlijdt. Dat komt omdat na periodes van verhoogde sterfte doorgaans minder mensen overlijden. Cijfers over de doodsoorzaak COVID-19 in het eerste halfjaar van 2020 zijn wel gebruikt om het leeftijdspatroon van de extra sterfgevallen vanwege de corona-epidemie te schatten.

    Voor 2020 is verondersteld dat 10 duizend mensen meer overlijden dan met de sterftekansen uit het geëxtrapoleerde model, voor 2021 nog eens 3 duizend mensen meer en voor 2022 nog duizend mensen meer. Deze aantallen zijn gebaseerd op schattingen van besmettingen in Nederland, het geschatte overlijdenspercentage en het aantal sterfgevallen tot eind oktober 2020. Dit is gecombineerd met de aanname dat de sterfte vanwege de corona-epidemie steeds verder zal afnemen vanwege maatregelen, meer kennis over het virus, nieuwe medicijnen en behandelmethodes, en uiteindelijk een vaccin. Hogere sterfte in het ene jaar betekent dat in de jaren daarna minder mensen zijn die kunnen overlijden. De hier genoemde extra sterfteaantallen zijn exclusief dit effect. Vanaf 2023 zijn de sterftekansen weer gelijk aan de sterftekansen uit het geëxtrapoleerde model. (...)
    Met andere woorden: de afdeling die deze demografische prognoses maakt, is in staat om een hele goede inschatting te maken van de oversterfte in de verschillende jaren: voor 2020 schatten ze dat op 10.000 (klopt heel behoorlijk) en voor 2021 op 3000 (klopt minder goed, maar is toch beter dan 15.000). Bij het bepalen van de verwachte sterfte op weekbasis kiest het CBS er voor 2020 en 2021 bewust en expliciet voor om deze schatting ter zijde te schuiven, zodat ze een uitspraak kunnen doen over ‘het verwachte aantal overledenen als er geen corona-epidemie was geweest’.

    En juist omdat het CBS de expertise in huis heeft om goede schattingen te maken, is het mij een raadsel waarom het zijn wekelijks gepubliceerde verwachting baseert op die fictieve wereld zonder corona. Op zijn minst zou het CBS hier veel duidelijker over moeten zijn, want nu lijkt iedereen te denken dat de waargenomen sterfte wordt afgezet tegen de reëel verwachte sterfte. Dat is dus niet zo.

  2. NASCHRIFT

    Pas ergens in september/oktober publiceert het CBS de cijfers over de precieze samenstelling van de bevolking op 1 januari 2022, cijfers die ik nodig heb om een uitspraak te doen over de verwachte sterfte van dat jaar.
    Niettemin kan ik wel een vrij grove schatting maken van het te verwachten aantal sterfgevallen in 2022. Van 2020 naar 2021 steeg mijn verwachting van 158.200 naar 163.500. In 2021 was er minder oversterfte dan in 2020, dus mijn verwachting stijgt minder hard. Ik zou dan uitkomen op 166.500. Als ik het patroon van het CBS goed inschat, zal dit bureau voor 2022 een sterfte verwachten van 156.500. Op voorhand liggen onze verwachtingen dus al 10.000 uit elkaar. Een mogelijke uitkomst is dan ook dat ik aan het eind van het jaar concludeer dat er sprake is van (een kleine) ondersterfte, terwijl het CBS nog steeds een grote oversterfte waarneemt. We zullen zien!


  3. Noten
    1. In het rapport staat wel dat de verwachting is dat de sterfte oploopt van 152.000 in 2019 tot 210.000 in 2055.
      Als er ieder jaar exact evenveel mensen méér sterven dan het voorgaande jaar, dat overlijden er ieder jaar 1611 mensen meer dan in het voorgaande jaar.
    2. Het CBS komt in haar verwachting voor 2020 op (154.402 – 151.885 = ) 1517 als meer-sterfte ten opzichte van 2019; Wellicht heeft het CBS de curve iets beter beschreven dan met een simpel lineair verband. Bij een dergelijk langzame trend is voor de korte termijn van 1 jaar een lineaire benadering echter altijd een redelijke benadering.
    3. En als men de trend al wil gebruiken om de curve te schalen, dan moet dat gemiddelde worden opgeteld bij de verwachting van het voorgaande jaar, niet bij de gemeten sterfte van dat jaar. In dat geval zou de verwachte sterfte voor 2020 ongeveer 155.400 bedragen, nog los van het bovengenoemde compensatie-effect.
    4. voor het cohort 65 – 80 jaar kom ik uit op 48.059, en voor het cohort 80+ jaar op een verwachte sterfte van 89.114. Dit levert voor alle 65+ jaar een totale verwachte sterfte op van 137.173. De sterfte onder 65- is door de jaren heen behoorlijk stabiel. Een redelijk schatting zou zijn 21.000. Daarmee komt de schatting voor 2020 in totaal op 158.173, nog afgezien van een eventuele correctie voor de ondersterfte van het voorgaande jaar.
    5. Soms zijn er kleine verschillen met de data die het CBS elders heeft gepubliceerd. Dat speelt met name voor weken waarvan de eerste dagen in het ene jaar vallen, en de latere dagen in het volgende jaar. Hiervoor is gecorrigeerd. Ook komt in 2020 en 2021 de verwachte sterfte niet exact overeen met het voorheen geponeerde getal. Mogelijk komt dit omdat het CBS in zijn verwachting ook nog een correctie aanbrengt voor de temperatuur in die week. De afwijkingen zijn klein. De waarden voor 2021 zijn voorlopige waarden, maar in praktijk zijn de bijstellingen naderhand gering.
    6. Deze 10.092 zou een redelijke benadering van de oversterfte moeten zijn. Daarbij is verondersteld dat het overgrote deel van de oversterfte plaatsvindt boven de 65 jaar, en dat boven die leeftijd het migratiesaldo geen rol van betekenis speelt.
      In mijn eerdere stuk besteed ik aandacht aan mogelijke kleine correcties.
    7. Dit kan enigszins onderschat zijn, omdat er mogelijk ook oversterfte plaatsvindt in de leeftijd 65- De cijfers van het CBS zijn niet gedetailleerd genoeg om hier een goede schatting van te maken.