Hajuvus vs kaldus
Statistilises ja tõenäosusteoorias tuleb sageli jaotuste erinevusi väljendada kvantitatiivsel viisil võrdluse jaoks. Dispersioon ja kaldus on kaks statistilist mõistet, kus jaotuse kuju on esitatud kvantitatiivsel skaalal.
Lisateave Dispersiooni kohta
Statistikas on dispersioon juhusliku muutuja variatsioon või selle tõenäosusjaotus. See näitab, kui kaugel andmepunktid asuvad keskväärtusest. Selle kvantitatiivseks väljendamiseks kasutatakse kirjeldavas statistikas dispersioonimõõtmeid.
Dispersioon, standardhälve ja kvartiilidevaheline vahemik on kõige sagedamini kasutatavad dispersiooni mõõtmed.
Kui andmeväärtustel on skaala tõttu kindel ühik, võivad ka dispersioonimõõtmetel olla samad ühikud. Interdetsiilide vahemik, vahemik, keskmine erinevus, mediaan absoluutne hälve, keskmine absoluutne hälve ja kauguse standardhälve on ühikutega hajuvuse mõõtmed.
Seevastu on dispersioonimõõtmeid, millel pole ühikuid, st mõõtmeteta. Variatsioon, variatsioonikordaja, kvartiilne dispersioonikoefitsient ja suhteline keskmine erinevus on dispersioonimõõtmed ilma ühikuteta.
Dispersioon süsteemis võib tuleneda vigadest, näiteks instrumentaal- ja vaatlusvigadest. Samuti võivad variatsioone põhjustada valimi enda juhuslikud erinevused. Enne andmekogumist muude järelduste tegemist on oluline omada kvantitatiivset ideed andmete varieerumise kohta.
Lisateavet Skewnessi kohta
Statistika osas on kaldus tõenäosusjaotuste asümmeetria mõõt. Kaldus võib olla positiivne või negatiivne või mõnel juhul olematu. Seda võib pidada ka normaaljaotuse nihke mõõtmiseks.
Kui kalduvus on positiivne, siis koondatakse suurem osa andmepunktidest kõverikust vasakule ja parem saba on pikem. Negatiivsuse korral on suurem osa andmepunktidest suunatud kõvera paremale poole ja vasak saba on üsna pikk. Kui viltus on null, jaotatakse üldkogum tavaliselt.
Normaalse jaotuse korral, st kui kõver on sümmeetriline, on keskmisel, mediaanil ja režiimil sama väärtus. Kui kaldus ei ole null, siis see omadus ei kehti ning keskmisel, režiimil ja mediaanil võivad olla erinevad väärtused.
Jaotuste viltuse määramiseks kasutatakse tavaliselt Pearsoni esimest ja teist kalde koefitsienti.
Pearsoni esimene kalduvus kohvi = (keskmine - režiim) / (standardhälve)
Pearsoni teine viltune kohvik = 3 (keskmine - režiim) / (Satndardi kõrvalekalle)
Tundlikumatel juhtudel kasutatakse kohandatud Fisher-Pearsoni standardiseeritud momendikoefitsienti.
G = n / (n-1) (n-2) ∑ni = 1 ((y-ӯ) / s)3
Mis vahe on hajumisel ja kaldusel??
Dispersioon puudutab andmepunktide jaotamise ulatust ja kalduvus jaotuse sümmeetriat.
Nii hajutatuse kui ka kalduvuse mõõtmed on kirjeldavad mõõdud ja kalde koefitsient näitab jaotuse kuju.
Andmepunktide vahemiku mõistmiseks ja keskmisest erinevuse saavutamiseks kasutatakse hajutatuse mõõtmeid, samal ajal kui kalduvust kasutatakse andmepunktide teatud suunas varieerumise mõistmiseks.