Statistika je nelaka stvar. Brojevi, brojevi, hrpa brojeva, brojevi u svezi s drugim brojevima, brojevi koji utječu na neke druge brojeve, brojevi koji nemaju veze s drugim brojevima, korelacije, odnosi, omjeri… Nije čudno što prosječna osoba obično nema volju baviti se statistikom. Nemam ni ja, a ponekad je nemaju ni statističari, no to je struka koju su si sami izabrali.

Statistika je alat koji nam omogućuje uvid u stvarnost, alat koji nam pokaže kakvo je stanje na terenu, a što ne mora biti u skladu sa stanjem u našim glavama. Statistika je tu neumoljiva i ne laže. Može li statistika ipak lagati, kao u onoj proverbijalnoj poslovici o “laži, prokletoj laži i statistici”?

Tehnički, ne: statistika je kutija s alatima, doduše matematičkim i poprilično kompliciranim, no alat sam po sebi nije kriv. Izaberete li pogrešan čekić ili okrenete pogrešnu stranu ispravnog čekića, umjesto zakucavanja čavla počiniti ćete fizičku, možda i duševnu bol samima sebi ili nekoj drugoj osobi koja pridržava čavao. Obično to nije namjerno. Ponekad jest.

Osoba koja se bavi statistikom može pogriješiti slučajno, ako pogrešno izabere parametre unutar kojih će primijeniti statističke alate, ali može “pogriješiti” i namjerno, svjesno birajući pogrešne parametre pomoću kojih će statistički alat prikazati rezultat koji odgovara počinitelju manipulacije.

Nedavno sam naišao na jedan izvrstan primjer koji vrlo jasno demonstrira jedan od najjednostavnijih načina manipulacije podacima tako da rezultat odgovara željenom, a ne istinitom: autor (koji vjerojatno želi ostati anoniman) je ustvrdio kako su epidemijske mjere uzrokovale ozbiljne psihičke probleme u populaciji:

Autor tako navodi, citiram:

  • porast od 82% u broju slučajeva prisilnih hospitalizacija kod shizofrenih poremećaja;
  • 68% porast hospitalizacija kod poremećaja prehrane/opsesivno-kompulzivnih slučajeva;
  • 35% porasta prisilnih hospitalizacija paranoje i akutnih psihotičnih poremećaja;
  • 9% porast slučajeva mentalnih poremećaja naših malih ‘vreća virusa’ sa krhkim ‘osjećajčićima’.

Autor grafa kritičar je epidemijskih mjera i njegov je argument kako se ovo sve dogodilo zbog lockdowna.

I, znate što? Kad ovo ovako pogledamo – ispada u pravu! Podaci su točni. Podaci nisu lažni, brojevi su ispravni, nema tu nikakve prevare.

U kojem se detalju onda krije proverbijalni vrag? Ako su brojevi dobro izračunati, onda moraju biti istiniti, a zaključak ispravan, zar ne?

Pa, ne.

Pogreška je u vrlo usko izabranom vremenskom opsegu koji ne daje širu sliku. Ovaj bi izračun bio ispravan samo ako u prijašnjim godinama ne bismo imali niti jedan slučaj od gore navedenih, pa ne bismo mogli uspoređivati dulje u prošlost. Trendove je iznimno teško predviđati u malim odsječcima; demonstrirajmo to jednostavnom igrom: vaš je zadatak pogoditi koji broj dolazi nakon ovih:

104, 23, 105, -16, 106, ?

Teško je procijeniti koji broj slijedi jer imamo tek tri broja koj bi mogli imati očiti slijed (104 -106), ali nije jednostavno uočiti zašto baš 23 i -16, i koji broj bi trebalo staviti umjesto upitnika. Pogledajmo niz u cijelosti:

100, 99, 101, 92, 102, 77, 103, 54, 104, 23, 105, -16, 106, ?

Kada imamo potpuniji set podataka, možda možemo pogoditi princip. Uočavamo kako niz započinje brojem 100, i kako je na svim neparnim pozicijama broj koji je za jedan veći od onog s prethodne neparne pozicije. Parne pozicije kreću gotovo iz iste vrijedosti, ali naglo padaju. No, zahvaljujući većem broju podataka u nekom trenutku možemo otkriti da nastaju tako što od brojeva na neparnim pozicijama oduzmemo kvadrat vrijednosti pozicije: broj 101 je na trećem mjestu, dakle 101-3^2=92. Potom 102-5^2=77. I tako dalje, pravilo odjednom postaje vrlo jasno i možemo ga ispravno nastaviti koliko god to želimo, ali ovo pravilo nikada ne bismo zaključili iz onog prvog, nepotpunog niza.

Iz tog primjera vidimo kako je vrlo teško pogoditi stvarni trend ako je broj uzoraka mali, ali što je veći broj uzoraka trend postaje sve jasniji. Tako i s ovim podacima, naprosto pogledajmo kako ti brojevi izgledaju kad ih stavimo u višegodišnju, puno širu perspektivu:

(link)

Uzevši u obzir duže vremensko razdoblje, a koristeći iste podatke kao i anonimni autor (samo u kompletnijem obimu), možemo steći širu sliku stvarnosti i provjeriti drže li gore navedeni argumenti vodu?

“porast od 82% u broju slučajeva prisilnih hospitalizacija kod shizofrenih poremećaja”

Iako je točno kako je usporedbom 2019. i 2021. godine uočen rast od 81% (krivulja na našem grafu blago ide prema gore), kad ovako jednostavno vidimo širu sliku možemo i tu naoko ogromnu promjenu staviti u perspektivu: pogledamo li graf, taj strašni rast odjednom ne izgleda više tako strašan, zar ne? Dapače, u odnosu na godine do 2016. čini se kako smo postali mentalno zbilja zdrava nacija!

Molim da uočite kako je autor, izabravši vrlo usko vremensko razdoblje, naštimao rezultat da vuče vodu na njegov mlin; širim pogledom uočavamo kako lockdown nije toliko utjecao na porast prisilnog liječenja; čak dapače, uzmemo li neke druge vrijednosti i njih statistički masakriramo, možemo primjerice reći kako je lockdown smanjio broj slučajeva prisilnog liječenja za gotovo 90% u odnosu na 2014. godinu.

U oba slučaja ne bavimo se dobrom (a ni poštenom) statistikom. No, ovaj moj argument da je lockdown pogodovao zdravlju jednako je (ne)valjan kao i onaj da je naštetio.

Ovaj graf problematičan je iz drugog razloga: nakon perioda rasta broja prisilnih hospitalizacija, vidimo da se u 2016. godini nešto promjenilo. Kako je malo vjerojatno da smo kao nacija postali psihički stabilniji i mentalno zdraviji u tako kratkom roku, ovakve rezultate proizvelo je nešto drugo. Što je to bilo, to tek treba otkriti. Možda su 2015. godine uvedena nova pravila hospitalizacije, ili je bolnicama nestalo novčanih sredstava, ili je možda neka druga politička intervencija u pitanju – ne znam. Ono što s priličnom sigurnošću mogu pretpostaviti je da se to nije dogodilo iz medicinskih razloga.

A rekao bih i kako se pad broja hospitalizacija primjeti na društvenim mrežama i u komentarima ispod novinskih članaka.

“68% porast hospitalizacija kod poremećaja prehrane/opsesivno-kompulzivnih slučajeva”

Ako je namjera autora bila reći kako su ljudi u nervozi lockdowna više jeli ili se osjećali nervozno, ja bih se s tim složio. Dugoročni trendovi, pak, ukazuju na to da jest bilo povećanja 2019.-2021. ali da je u prosjeku broj slučajeva tu negdje kao i prije, i ne odskače značajno. Dapače, i ovdje vidimo da je vrhunac bio 2015. godine, nakon čega slijedi pad, ali općeniti trend ne pokazuje tako veliki rast kako autor pokušava prikazati.

“35% porasta prisilnih hospitalizacija paranoje i akutnih psihotičnih poremećaja”

Ovaj grafikon očekivano je sličan grafikonu prisilnog liječenja shizofrenih poremećaja. I ponovo imamo isti primjer loše statistike, gdje zbog uskog vremenskog opsega ne vidimo širu sliku. Sve navedeno u primjeru shizofrenije važi i za ovaj argument. Inače, broj U62B slučajeva koji nisu zahtjevali hospitalizaciju u periodu 2019.-2021. pao je za 14.5% – kako to objasniti, ako je lockdown tako strašno psihički poguban?

“9% porast slučajeva mentalnih poremećaja naših malih ‘vreća virusa’ sa krhkim ‘osjećajčićima’”

Izuzmemo li autorov pokušaj sotoniziranja znanstvenika i medicinara koji se zalažu za lockdown ili cijepljenje djece, ovaj graf otkriva nam ne samo emocionalnu manipulaciju autora, već i tužnu činjenicu da ovdje možemo jasno uočiti rastući trend mentalnih poremećaja u dječjoj dobi koji raste od 2012. godine, da bi u pandemijskoj 2020. godini zabilježio pad i potom se 2021. godine zapravo “vratio na staro”, u svom lošem smjeru. Ovdje bih ja mogao protivnički-slavodobitno vikati “gle kako je lockdown u 2020. smanjio broj mentalnih poremećaja djece, aha! aha!” – no, to bi bilo pogrešno jer bih počinio istu manipulatorsku pogrešku; što je točno uzrokovalo taj pad mogu samo nagađati – je li to bila posljedica smanjene mentalne skrbi i posljedično manje dokumentiranih slučajeva, ili je ostanak kod kuće u obitelji blagotvorno djelovao na djecu, ili je možda čak i online nastava blagotvorno djelovala na dječju psihu… sve su to samo nagađanja. Jednostavno ne znam što se dogodilo, niti sam stručan procjenjivati što bi mogao biti uzrok, a tema je isuviše ozbiljna da bih se usudio njome špekulirati i koristiti kao neki svoj privatni argument. Ono što jasno vidim, nažalost, jest taj nesretni trend koji se povećava i zbilja bismo nešto trebali učiniti po tom pitanju: epidemijske mjere ne smiju nam biti izlika za nečinjenje.

Gdje je istina?

Ja – ne znam. Nisam stručan procjeniti što se događa s mentalnim zdravljem nacije. Jednako kao i statistika anonimnog autora, i ova moja (čitaj: koju je izvukao Petar Palašek iz podataka CEZIH-a, a ja samo nalijepio ovdje) je nepotpuna – ide tek do 2011. godine – i kao takva ne seže dublje u prošlost, gdje bismo možda mogli pronaći dodatne važne djeliće ove slagalice.

Ono što mogu reći je da je statistika koju sam ja prikazao bliža istini od statistike anonimnog autora. Iako je i njegova matematički ispravna, činjenica da je izabrao tako mali uzorak ukazuje na to da je, matematičkoj ispravnosti unatoč, ovaj izračun napravljen ne da bi tragao za istinom, već da bi nametnuo autorovu viziju istine. Iz ovih je primjera vrlo razvidno kako jednostavnom operacijom, povećanjem uzorka (tj. prikazivanjem više godina) možemo vrlo lako otkriti da stvarnost nije onakva kakvu nam je žele prikazati. Zbog toga uvijek treba biti oprezan kad nam netko pokuša statističke podatke prikazati kao neumitnu istinu: možda ta statistika nije dobro odrađena, možda se autor lupio statističkim čekićem po prstu, a možda je autoru i bila namjera tim čekićem lupiti vaš prst.

P.S. zaista, što se to u sustavu dogodilo 2015. godine?!?!

Visits: 326