Rovnoměrné a normální rozložení četnosti

Existují dvě typická rozložení četnosti, se kterými se můžeme i v praxi běžně setkat. Jedná se o rovnoměrné rozložení četnosti a o normální rozložení četnosti.

Rovnoměrné rozložení četnosti

Rovnoměrné rozložení znamená, že se v našem souboru všechny hodnoty vyskytují stejně často. Můžeme například spočítat, kolik měsíců měly roky 2000, 2001, …, 2009:

Pokud hodíme klasickou zidealizovanou kostkou, máme pravděpodobnost $\frac16$, že nám padne 1, pravděpodobnost $\frac16$, že nám padne 2 atd. Mluvíme tak o rovnoměrném rozložení pravděpodobnosti, protože každý výsledek má stejnou pravděpodobnost.

Nerovnoměrné rozložení by bylo, kdybychom měli cinknutou kostku, na které by s pravděpodobností $\frac13$ padala vždy šestka. Ostatní strany nemohou mít také pravděpodobnost $\frac13$. Stejně tak bychom mohli spočítat počet dnů v jednotlivých měsících — ne všechny měsíce mají stejný počet dnů, takže by se nejednalo o rovnoměrné rozložení četnosti.

Normální rozložení pravděpodobnosti

Normálnímu rozložení se někdy také říká Gaussovo rozdělení. Používá se pouze u spojitých náhodných proměnných. Standardizované normální rozložení ma takový tvar:

Standardizované normální rozložení pravděpodobnosti

Tato křivka je popsána tzv. Gaussovou funkcí, která má tvar:

$$ \Large f(x) = \frac{1}{\sigma\sqrt{2\pi}} \mathrm{e}^{-\frac{{(x-\mu)}^2}{2\sigma^2}} $$

Funkce je poměrně složitá, pamatovat si ji nemusíte. Vidíme ale, že normální rozložení můžeme parametrizovat pomocí průměru a směrodatné odchylky/rozptylu. Pro různé hodnoty průměru a odchylky pak můžeme dostat různé grafy:

Různé normální rozložení

Normální rozložení je důležité proto, že poměrně věrně simuluje různá rozložení, se kterými se můžeme reálně setkat. Vidíme, že křivka má vždy jedno globální maximum, které je zároveň rovno průměrné hodnotě. Například červená křivka má maximum v bodě X = 0, průměrná hodnota této veličiny je tak nula. Křivka je symetrická, je osově souměrná s přímkou, která je kolmá k ose X a prochází průměrem, tedy bodem X = 0. Jinými slovy — křivky vypadá nalevo od nuly stejně jako napravo od nuly. Zelená křivka má tytéž vlastnosti, pouze se s nulou, ale s bodem X = −2.

Normální rozložení může věrně popisovat rozložení inteligence či IQ mezi lidmi. Průměrná hodnota IQ je — z definice — 100. Přitom platí, že je přibližně stejný počet lidí, kteří mají IQ vyšší než 100 a nižší než 100. Lehce podprůměrně inteligentních je přibližně stejně jako lehce nadprůměrně inteligentních a blbců je stejně jako géniů. Ač se to občas nezdá :-). Graf zobrazující přibližné rozložení IQ:

Rozložení IQ

U normálního rozložení hraje velkou roli směrodatná odchylka. Pokud máme rozložení, které je normální a má odchylku $\sigma$, pak musí platit, že 68 % hodnot se nachází v intervalu $\left<\mu-\sigma, \mu+\sigma\right>$. Tedy 68 % hodnot se liší od průměru maximálně o jednu směrodatnou odchylku. Přibližně 95 % hodnot pak musí ležet v intervalu $\left<\mu-2\sigma, \mu+2\sigma\right>$ a 99,7 % hodnot v intervalu $\left<\mu-3\sigma, \mu+3\sigma\right>$. Přehledně to znázorňuje následující obrázek:

Normální rozložení a směrodatná odchylka

Odkazy a zdroje