Aby som to zhrnul, vo všeobecnosti, ak je distribúcia údajov vychýlená doľava, priemer je menší ako medián, ktorý je často menší ako režim. Ak je distribúcia údajov skosená doprava, režim je často menší ako medián, čo je menej ako priemer.
Prečo je medián menej ovplyvnený skreslenými údajmi?
Prečo je medián menej ovplyvnený skreslenými údajmi ako priemer? Keď sa však údaje stanú skreslenými, stredná hodnota stratí schopnosť poskytnúť najlepšie centrálne umiestnenie údajov, pretože skreslené údaje ich posúvajú preč od typickej hodnoty.
Prečo je lepší medián pre skreslené údaje?
Pre distribúcie, ktoré majú odľahlé hodnoty alebo sú skreslené, je medián často preferovaným meradlom centrálnej tendencie, pretože medián je odolnejší voči odľahlým hodnotám ako priemer… Všimnite si, že stred sa ťahá v smere zošikmenia (t. j. v smere chvosta).
Pri zošikmení doprava je stredná hodnota?
Pre pravo šikmé rozdelenie je priemer zvyčajne väčší ako medián Všimnite si tiež, že koniec rozdelenia na pravej (kladnej) strane je dlhší ako na strana po ľavej ruke. Z krabicového a fúzového diagramu tiež môžeme vidieť, že medián je bližšie k prvému kvartilu ako k tretiemu kvartilu.
Ako ovplyvňuje šikmosť údajov?
Efekty skreslenia
Ak je v údajoch príliš veľa skreslenia, tak mnohé štatistické modely nefungujú, ale prečo. Takže v skreslených údajoch môže chvostová oblasť pôsobiť ako odľahlá hodnota pre štatistický model a vieme, že odľahlé hodnoty nepriaznivo ovplyvňujú výkonnosť modelu, najmä modely založené na regresii.