Bez zařazení

Článků v rubrice: 401

Křivé zrcadlo statistiky aneb pozor na správný výklad čísel (1)

Čísla si hrají s naším podvědomím, ovlivňují náš úsudek a podílejí se na vytváření našeho názoru, a to v mnohem větší míře, než jsme ochotni si často připustit. Fenomén přílišné důvěry, kterou chováme k výsledkům nejrůznějších statistik, grafů a průzkumů veřejného mínění, už delší dobu samotné odborníky – statistiky – dráždí. Často proto kritizují manipulativní kroky žurnalistů, politiků, manažerů a obchodníků. Ne každý statistik však disponuje takovou schopností věci zajímavě vysvětlit, tak jako RNDr. Simona Poláková letos v únoru ve svém vystoupení v rámci cyklu přírodovědných přednášek ScienceZoom v Českých Budějovicích. Simona Poláková je zooložka a biostatistička pracující na Přírodovědecké fakultě Jihočeské univerzity v neziskové organizaci Beleco věnující se praktické ochraně přírody. Zkrácený text její přednášky nabízíme ve dvou pokračováních.

Fotogalerie (1)
Ilustrační foto

Simona Poláková se rozhodla popsat základní spektrum jevů, ke kterým dochází, když si neodborníci pohrávají s výsledky statistiky, nebo naopak, když odborníci pomocí přesných čísel dokáží ve svůj prospěch manipulovat veřejným míněním a zkresleně interpretovat výsledky vědeckých studií. Na co bychom si tedy měli dávat pozor? Simona Poláková to stručně vyjádřila v závěru přednášky slovy:

Dávejte si pozor na čísla, protože ty vždycky vzbuzují větší důvěru než obecné prohlášení. U průzkumů vždycky myslete na to, kdo a proč je dělal. Povšimněte si, co vlastně ve skutečnosti zjišťovali, a dbejte opatrnosti na to, co říká výzkum, a co nám tvrdí interpretátor, ať už je to novinář, PR odborník, aktivista nebo politik. Zbystřete kdekoliv, kde uvidíte průměrné hodnoty, a buďte opatrní na podezřele přesná čísla. Bděte nad velmi přesvědčivými grafy, nad jejich legendou. Používejte vlastní rozum, když je vám předložena nějaká vztahová závislost, a všímejte si, zda se nejedná o záměnu příčiny a důsledku, nebo vliv třetích faktorů. Prostě, když jde o čísla, buďte vždycky opatrní.“

Čísla, na nichž stojí svět

Na ukázku uveďme dvě prohlášení, na která můžete narazit v tisku. To první zní: „Většina občanů ČR si nepřeje rozpad Ukrajiny“, druhé: „Celkem 80 % občanů ČR si nepřeje rozpad Ukrajiny“. Zeptejte se sami sebe, které z těchto dvou tvrzení působí důvěryhodněji a přesvědčivěji. Pochopitelně, většinu lidí více přesvědčí číselný, procentický údaj, který vypadá tak nějak hodnověrně. Lidé mají tendenci věřit číslům, jejich exaktnosti, aniž by tušili, co je vlastně za nimi.

Mimochodem, to není žádné nahodilé tvrzení, a já si takový průzkum připravila sama, podle pravidel, která se běžně pro podobné průzkumy veřejného mínění používají,“ popisuje Poláková. „Cestou na vlak jsem prostě na nádraží náhodně oslovila deset lidí, a získala jsem taková data.“

V konečném důsledku je obsah obou tvrzení naprosto rovnocenný. Protože to, co si myslí deset lidí v Praze na Hlavním nádraží ve skutečnosti o ničem nevypovídá. A jsme u kořene problému – když nějaký podobný titulek nebo informaci čteme v novinách, nevíme, co značí těch osmdesát procent. Netušíme, kolik respondentů vlastně odpovídalo, a jestli takový průzkum veřejného mínění probíhal v Praze na Hlavním nádraží, nebo se jen dotyčný redaktor přeptal deseti kolegů v kanceláři. Většinou se tyto informace v textu už neuvádějí, ale my bychom, pokud si už na základě takových informací chceme udělat nějaký názor, měli projevit snahu se dopátrat, k jakým údajům se výsledky takového průzkumu vlastně vztahují.

Statistika je nástroj,“ říká Poláková. „Jen nástroj, není to řešení všehomíra. Jenže lidé mají tendenci hledět na matematická vyjádření a čísla s úctou. Statistika je důležitá, nahrazuje dojmy, a v náhodném světě nám pomáhá najít pravidla a podobnosti. Jednostranná adorace číselných vyjádření nám však škodí.

V zajetí pravděpodobností

Příklad, který nepotěší, zvlášť pokud se vás osobně týká. Představte si test na HIV, jehož přesnost je 99 %. Test vám vyšel pozitivně. Jakou máte asi šanci, že nebudete potřebovat antivirotika? Jaká je šance, že test vyšel špatně?

Pravděpodobnost chyby je v tomto případě 1 %. To znamená, že v jednom procentu případů je tento test špatně. To ale také znamená, že právě to jedno procento se vztahuje jak na negativní, tak na pozitivní výsledky. Takže na to, abyste měli falešný pozitivní test, musíte započítat nejen jedno procento pravděpodobnosti chyby, ale i pravděpodobnost toho, že HIV nemáte. Záleží tedy spíše na prevalenci této nemoci v populaci. V zásadě tak máte – v případě negativního výsledku – větší šanci, že ten test vyšel špatně. Protože těch negativních případů je u nás prostě víc.

Velký problém může nastat, když si špatně vypočítanou pravděpodobnost na pomoc vezmou experti, kterým se věří proto, že jsou odborníci v jiném oboru. V USA zemřely dvě děti jedné matky na syndrom náhlého úmrtí dítěte (SNU). Následně byla tato matka odsouzena za dvojnásobnou vraždu. Hlavním důkazem byl názor pediatra, který na základě toho, že pravděpodobnost výskytu SNU u jakéhokoliv dítěte je 1 : 8500 spočítal, že pravděpodobnost výskytu dvou SNU je 1:72 500 000, což je natolik nepravděpodobné, že matka nutně musí být vražedkyní.

Jenže je tu jedna okolnost – ty dvě mrtvé děti měly stejnou matku. Vzhledem k tomu, že nevíme, co způsobuje SNU, tak ani nevíme, jaké genetické či environmentální vlivy za ním stojí. Ty dvě děti rozhodně nebyly nezávislá pozorování, aby bylo možné takový výpočet provést. A ještě tomu nasadili korunu novináři, kteří přesvědčovali veřejnost, že „Šance na nevinu dvounásobné vražedkyně je 1 : 73 milionům“. Číslo, spočtené expertem a vztažené k něčemu úplně jinému, využili pro demonstraci něčeho, k čemu se vůbec nevztahuje.

Zhouba novinářských zkratek

Představte si téměř oslavný dlouhý titulek v novinách: „Studie poukázala na to, že nová metodologie ve firmě XY ztrojnásobuje tvrdost oceli“. Co to ale vlastně znamená? Ta informace je ve své podstatě úplně planá. Znamená to snad, že ta metoda ztrojnásobuje sílu oceli oproti jiné oceli z firmy XY? To klidně může znamenat, že dosavadní ocel ve XY bylo docela pěkné šméčko, a tímhle opatřením se konečně dostali na úroveň zbytku světa. Nebo to značí, že ji ztrojnásobuje oproti všem ocelím? Začneme tedy místo diamantů používat ocel? Chybí tu totiž informace o tom, vůči jaké oceli, jakého typu, je to srovnáváno. Novinářské zkratky ale nepoužívají jen novináři. Přisoudit úplně jiný význam nějakému číslu, k tomu máme sklony často všichni.

Podobným případem je nehodovost na silnicích. Určitě si vybavíte zprávu, která nám tvrdí, že „Nehodovost na silnicích činila v tomto měsíci XX, což je nejvíce za posledních třináct let.“ Co to ale znamená? V zásadě nic, protože jednou ta nehodovost prostě nejvyšší být musí, stejně tak, jako jednou musí být nejnižší. To je prostá vlastnost jakéhokoli jevu.

Čistě teoreticky můžeme spolehlivě statisticky doložit, že nejbezpečnější je jezdit za mlhy a deště, i když to může znít divně. Ale za mlhy se skutečně stalo nejméně nehod, pokud to nevztáhneme k faktu, že mlžných dnů je v zásadě u nás mnohem méně, než těch slunečných. Z podobné série tvrzení vychází i informace, že „je určitě bezpečnější jezdit po Praze v osm večer, než v osm ráno.“ Jistě, můžete argumentovat počtem nehod večer i ráno, ale pokud započítáme i počet aut, která se v ten který moment na silnici vyskytují, vyjde nám, že je to obojí zhruba stejně nebezpečné.

Určitým řešením by bylo poukazovat na jednotlivé trendy,“ navrhuje Poláková. „To, jestli kriminalita roste, nebo nehodovost dlouhodobě klesá. Ale mnohdy nám chybí jakýsi základní stav, baseline, ten základní stav, vůči kterému se to ostatní srovnává. Co všechno bylo zohledněno a podobně.“

Čísla, která pracují pro nás. Když se to hodí.

V Jižních státech USA došlo na počátku 60. let k výraznému ústupu malárie. V zásadě se ale na tomto mimořádném úspěchu podepsal fakt, že byla zpřístupněna nová metoda lékařské analytiky, která umožnila mnohem levněji, přesněji a snadněji identifikovat malárii jako příčinu úmrtí. Do té doby se prostě malárie zapisovala jako příčina úmrtí u všech zesnulých, kteří měli jakž takž podobné symptomy, které se mimochodem podobají třeba chřipce. Díky nové metodě se tak začaly zaznamenávat jen ty skutečné, průkazné případy.

Navíc se tento případ spojil s další událostí, která náhodou probíhala ve stejné oblasti. Jednalo se o postřiky a práškování bažin a mokřadů, které měly potírat populace komárů šířících malárii. Původně byl tedy propad malárie přičítán tomu, že opatření s postřikem byla tak účinná. V podstatě až v devadesátých letech se přišlo na to, že vzhledem ke krátkému časovému úseku (asi dvou let) od postřiků, není úspěch na potlačení malárie možné přičíst na vrub okamžitému úspěchu postřiků.

Podobným příkladem je i nedávná informace z Čech. „Od roku 2011 jsme mnohem zdravějším národem“. Mohou za to snad diety, zdravá strava, cvičení či plošné omezování kouření? Vtip tkví v zavedení třídenního neproplácení nemocenské. Jenže grafy, pokud se na ně budeme dívat bez znalosti podrobností, hovoří jasně. Nemocnost se rapidně snížila. To, že lidé budou raději přecházet nemoc, nebo si vezmou dovolenou, aby nemuseli mít tři dny neplacené nemocenské, to už nám graf neprozradí.


RNDr. Simona Poláková

Absolventka PřF JU v Českých Budějovicích. V rámci studia se věnovala především ekologii a etologii ptáků, zároveň spolupracovala na mnoha nesouvisejících projektech jako statistička. Její vědecká práce zahrnuje jak analýzy dlouhodobých změn v početnosti vodních ptáků v České republice, tak vegetační změny díky různým managementům na šumavských loukách, srovnávání různých environmentálních testů na stanovování znečištění vod či změny kognitivních schopností u pacientů po operaci mozku. Také se věnuje výuce statistiky na PřF JU. Od roku 2010 pracuje v neziskové organizaci DAPHNE ČR – Institut aplikované ekologie (nyní Beleco), kde své teoretické znalosti uplatňuje v praxi aplikovaného výzkumu a plánování monitoringů na místní i republikové úrovni.

Dokončení příště

Radomír Dohnal
Poslat odkaz na článek

Opište prosím text z obrázku

Nejnovější články

GloWAL: mapování globálních vodních zdrojů

67. Generální konference IAEA (Mezinárodní agentury pro atomovou energii) ve Vídni letos v létě vyzvala státy světa, aby se připojily k nové iniciativě – laboratorní síti, která ...

Fotovoltaika pod sněhem

Více než 20 tisíc českých domácností už má na střeše vlastní elektrárnu a tisíce dalších se k tomu chystají.

První plazma největšího tokamaku na světě

V sedmdesátých letech bylo jasné, že tokamak pro termojadernou fúzi udrží plazma potřebnou dobu, bude-li dostatečně velký. Stavěly se giganti JET (1983, EU), TFTR (1982, USA), JT-60 (1985, Japonsko), T-15 (1988, SSSR) a další.

Nejžhavější sen pod Sluncem

Třípól měl tu čest, že byl přímo u křtu nejnovější knihy o jaderné fúzi na českém knižním trhu. Šéfredaktorka Marie Dufková jí byla 3. listopadu kmotrou. Knížku napsal prof.

Centrální solenoid ITERu

Tokamak je v podstatě transformátor. Primární vinutí u tokamaku ITER se nazývá centrální solenoid. První tokamaky, jako správné transformátory, měly obě vinutí, ...

Nejnovější video

Jak funguje PCR test na coronavirus

Krásně a jednoduše vysvětleno se srozumitelnými animacemi. V angličtině.

close
detail