Rośnie w Polsce śmiertelność wśród 30 latków.

Porównanie tylko 4 grup wiekowych w klasyczny sposób, na zwykłym wykresie jest dość kłopotliwe. Widać co prawda duże anomalie, ale w gąszczu zmian umykają nam subtelności. Jest też kłopot porównywania różnych grup, linia żółta oscylując wokół 80. zgonów tygodniowo nadaje wysokość skali to trudniej nam ocenić zmiany na linii czerwonej, występującej w innej lidze ze średnią na poziomie 30 zgonów tygodniowo.

Wykres 1. Liczba zgonów tygodniowo w grupach wieku.

Mądry człowiek sobie poradził z tym w prosty sposób, stworzył miarę wystandaryzowaną Z-score. Co to jest? Zacznijmy od tego, że będziemy analizować jak coś się odchyla od normy. Za normę uznałem lata 2015-2019. Na przykładzie linii żółtej przyjmijmy, że jest to średnio 80 zgonów tygodniowo, ale gołym okiem widać, że prawie nigdy nie zdarza się, aby to było 80. Poszarpany wykres mówi nam, że istnieje naturalna zmienność tego zjawiska, po części losowa a po części zdeterminowana choćby sezonowym wstępowaniem grypy zimą. Grypa to nie przelewki i może położyć też 30-latka.

Zmienność mierzy się miarą zmienności, „odchyleniem standardowym”. Co to za zwierze? Łatwo je oswoić: to jest najprościej mówiąc „średnie odchylenie od średniej”, nie będziemy tu wchodzić w niuanse. Wyobraźmy sobie, że sumujemy wszystkie odchylenia od średniej i tę sumę dzielimy przez liczbę pomiarów (tygodni). Otrzymujemy wynik, który nam mówi o ile lat średnio wyniki różnią się od średniej. Dla linii żółtej takie jedno odchylenie standardowe to ok. 10 zgonów, dla linii czerwonej będzie to około 5 zgonów, ale to będzie jedno czerwone odchylenie standardowe. Po ludzku każdą grupę mierzymy jej miarą. Na drugim wykresie widzimy, że do roku 2019 zasadniczo wszystko mieściło się w przedziale -5:+5 odchyleń standardowych. Kto się uczył, pamięta że wartości +- 4 odchylenia standardowe wyczerpują 99,993663% zdarzeń „normalnych”. Kto dotrwał, ma zaliczony pierwszy semestr ze statystyki…

Wykres 2. Odchylenie liczby zgonów tygodniowo miarą Z-score w grupach wieku.

Widzimy też do roku 2019, że naturalna zmienność to też częste występowanie danego koloru nad i pod zerem, czyli nad i pod średnią. Gdy w roku 2019 na wykresie 2. widzimy duże skupienie czerwonego nad osią to musimy wnioskować, że to był zły rok dla młodych w wieku 20-24, zapewne to wypadki drogowe i utonięcia, skupiają się na późną wiosnę i gorące lato. Tego właśnie na pierwszym wykresie nie widać, a to jest w analizie najważniejsze.

Na drugim wykresie zrobiłem jeszcze coś ważnego: kolorowe słupki dla każdego tygodnia się dodają. Dzięki temu udział każdego koloru w danym słupku, pokazuje ile do całkowitego wychylenia wnosi dana grupa wiekowa, ale miarą standaryzowaną, niezależną od tego jak dana grupa jest duża. To likwiduje efekt skali dla grup małych. W tej sytuacji tragikomiczne jest, że wraz z nastaniem epidemii od marca 2020 liczba zgonów spada znacznie poniżej średniej na wiele miesięcy. Zdradzę tu, że dotyczyło to wszystkich grup z wyjątkiem urodzonych w latach 1946-1950, starsi, urodzeni w czasie wojny dobrze przetrwali pierwszy lockdown, a akurat ci nie. I mamy kolejną zagadkę.

Paweł Klimczewski

Jeśli uważasz moje analizy i publikacje za pożyteczne możesz mnie wesprzeć dowolną kwotą na konto:

mBank : 87 1140 2017 0000 4002 1094 2334

Paweł Klimczewski, tytułem: wpłata

Dziękuję ze wsparcie niezależności mediów w Polsce.