Medián

Kapitoly: Průměr, Medián, Modus

Medián zjednodušeně řečeno dělí nějaký soubor hodnot tak, aby polovina hodnot byla menší než medián a druhá polovina hodnot větší než medián. V realitě je to trochu složitější a na to se teď podíváme.

Co je to medián

U mediánu hraje roli, jestli je počet prvků populace sudý, nebo lichý. V případě, kdy je počet prvků populace lichý, získáme medián tak, že seřadíme všechny hodnoty od nejmenší po největší a hodnota, která je přesně uprostřed, bude mediánem.

Pro příklad si vezmeme soubor čísel 75, 4, 2, 3, 2, 5, 1. Je jich celkem 7, což je liché číslo. Čísla seřadíme, čímž získáme posloupnost 1, 2, 2, 3, 4, 5, 75. Mediánem, který označíme $\mbox{Me}$, bude prvek, který je uprostřed, což je číslo 3. Obecný vzorec pro populaci X o velikosti |X| = N, jejíž prvky jsou xi a jsou seřazené od nejmenšího po největší, by tak byl:

$$ \mbox{Me}(X) = x_{(N+1)/2} $$

Pokud bychom to zkusili pro náš soubor hodnot X = [1, 2, 2, 3, 4, 5, 75], tak bychom získali:

$$ \mbox{Me}(X) = x_{(N+1)/2} = x_{(7+1)/2} = x_{8/2}=x_4=3 $$

Pro sudý počet prvků musíme provést drobnou úpravu, protože sudá posloupnost hodnot nemá "prvek uprostřed". Když z naší populace ubereme jednu dvojku, získáme populaci: Y = [1, 2, 3, 4, 5, 75] a ta nemá žádný prostřední prvek. Obě čísla 3 a 4 jsou "stejně uprostřed". V tomto případě se to řeší tak, že se vezmou oba prvky, které jsou takto uprostřed a mediánem bude jejich aritmetický průměr. Mediánem hodnot Y by tak byla hodnota (3 + 4)/2 = 3, 5.

Obecný vzorec pro hodnoty X o velikosti N se seřazenými prvky xi by vypadal takto:

$$ \mbox{Me}(X) = \frac{x_{N/2} + x_{(N/2)+1}}{2} $$

Pokud takto vypočítáme medián hodnot Y = [1, 2, 3, 4, 5, 75], kde prvky označíme yi, získáme:

$$ \mbox{Me}(Y) = \frac{y_{N/2} + y_{(N/2)+1}}{2} = \frac{y_{6/2} + y_{(6/2)+1}}{2} = \frac{y_3 + y_4}{2} = \frac{3+4}{2}=3,5 $$

Výhody mediánu

Medián, na rozdíl od průměru, netrpí problémy, pokud jsou v souboru hodnot nějaké extrémy. Ve výše zmíněném příkladu se souborem X = [1, 2, 2, 3, 4, 5, 75] bychom získali průměr $92 / 7 \approx 13.1428$, což je taková trochu divná hodnota, když šest ze sedmi prvků je daleko menších. Mediánem je pak rozumné číslo tři.

Medián lze dále použít pro všechny hodnoty, které lze nějak seřadit. Průměr můžeme udělat jen u hodnot, které dokážeme sečíst a následně vydělit. Můžeme si vzít například velikost oblečení: tam bývá nějaká posloupnost typu XS, S, M, L, XL, XXL. Těžko bychom z takových hodnot udělali průměr, protože není jasně dané, jak sečíst XS + L nebo XL + L a není ani jasné, jak bychom to nakonec vydělili. Nicméně pokud nějaká populace koupila oblečení S, S, M, L, L, L, XXL, tak můžeme říci, že mediánem je velikost L. Problém může nastat ve chvíli, kdy máme sudý počet velikostí, protože pak nemůžeme udělat aritmetický průměr. V tomto případě obvykle prostě zvolíme jedno ze dvou prostředních čísel jako medián.