Jiří Zajíc

Osobní web

Statistika

Počet zobrazení článků
148530

Připojeni

Právě přítomno: 37 hostů a žádný člen

Citát

Klam

Můžete klamat svým počínáním některé lidi nějaký čas, některé dokonce po celý čas, ale nikdy ne všechny po celý čas.

Abraham Lincoln

 

Výpočet prezidenta

úředním šimlem

Když v médiích proskočily zprávy o chybné metodice výpočtu neplatných hlasů v peticích pro volbu prezidenta, chvíli jsem se neorientoval. Když jsem se seznámil s potřebnými informacemi, užasl jsem nad mírou nekompetentnosti posuzovatelů.

Výlet do statistiky

Ve statistice rozeznáváme dvě hlavní odvětví – statistiku popisnou a statistiku výběrovou. Statistika popisná pracuje se všemi prvky souboru, výběrová na základě vlastností výběru usuzuje na vlastnosti celku. Tedy máme-li například 10000 objektů, v rámci popisné statistiky je zkontrolujeme všechny. Ve výběrové statistice si z oněch 10000 objektů vybereme například 2 vzorky po 1000 objektech. Zkontrolujeme je a usoudíme na pravděpodobné vlastnosti celku. Jedná se o pravděpodobnost, protože 8000 oněch objektů jsme vůbec nekontrolovali.

Jednoduchý příklad

Popisná statistika

Zkontrolujeme 10000 kuliček červené a modré barvy. Najdeme například 4000 červených a 6000 modrých, tedy 40% červených a 60% modrých.

Výběrová statistika

Ze stejného souboru naslepo vybereme dva vzorky po 1000 kuličkách. V jednom najdeme 380 červených a 620 modrých, tedy 38% červených a 62% modrých. Ve druhém najdeme 400 červených a 600 modrých, tedy 40% červených a 60% modrých. Ve výběru 2000 kuliček, skládajícím se z těchto dvou vzorků, je tedy 780 červených a 1220 modrých, tedy 39% a 61%. 1% rozdílu je v podstatě takzvaná statistická chyba, znamenající, že ani poctivě udělaný výběr nereprezentuje celek úplně přesně. Statistika má postupy, umožňující stanovit pravděpodobnou hodnotu této statistické chyby.

Šiml řehtá a hrabe kopytem

Sešla se komise MV, dostala tento soubor kuliček a vybrala výše uvedené dva vzorky. Veřejnosti moudře sdělila, že našla v souboru 10000 kuliček vzorky s 60% a 61% modrých, tedy 120% modrých. Soubor 10000 kuliček tedy obsahuje 12000 modrých.

Kulaté razítko.

V čem je chyba?

Dělení není komutativní operace. To znamená, že sčítáme-li před dělením a po dělení, dostaneme různé výsledky. Myslím, že se to učí v 6. třídě ZŠ. Závěr si laskavý čtenář udělá sám.

A znovu statistika

Pokud se dělají korektní statistické výpočty, patří k výpočtu odhad statistické chyby. Trochu vzdálené a nepřesné připodobnění: nejistota měření policejním radarem je +-3km/h. Proto vám hlídka od naměřeného údaje odečítá 3km/h, aby se vyloučily pochybnosti o nepřesnosti měření. Nejde náhodou při volbě prezidenta o víc? Při "výpočtu prezidenta" vůbec nejsou brána v úvahu dvě základní rizika - že bude na základě výběrové statistiky vyřazen kandidát, který ve skutečnosti má podpisů dost, nebo propuštěn do volby kandidát, který ve skutečnosti má podpisů málo.

Copyright © 2019. All Rights Reserved.