Variatsioon vs kovariatsioon
Variatsioon ja kovariatsioon on kaks statistikas kasutatavat mõõt. Variatsioon on andmete hajuvuse mõõt ja kovariatsioon näitab kahe juhusliku muutuja muutumise astet koos. Variatsioon on pigem intuitiivne mõiste, kuid kovariatsioon määratletakse matemaatiliselt nii, et see pole alguses nii intuitiivne.
Lisateave Variance kohta
Variatsioon on andmete hajutatuse suurus jaotuse keskmise väärtuse järgi. See näitab, kui kaugel asuvad andmepunktid jaotuse keskmisest. See on üks tõenäosusjaotuse esmaseid kirjeldajaid ja üks jaotuse momente. Samuti on dispersioon populatsiooni parameeter ja populatsiooni valimi dispersioon on populatsiooni dispersiooni hinnang. Ühest küljest on see määratletud kui standardhälbe ruut.
Lihtsas keeles võib seda kirjeldada kui iga andmepunkti ja jaotuse keskmise vahemaa ruutude keskmist. Variandi arvutamiseks kasutatakse järgmist valemit.
Var (X) = E [(X-µ)2 ] elanikkonna jaoks ja
Var (X) = E [(X-xx)2 ] proovi jaoks
Seda saab veelgi lihtsustada, et saada Var (X) = E [X2 ] - (E [X])2.
Variatsioonil on mõned allkirjaomadused ja seda kasutatakse statistikas sageli kasutamise lihtsustamiseks. Variatsioon on mittenegatiivne, kuna see on vahemaade ruut. Variatsioonivahemik pole siiski piiratud ja sõltub konkreetsest jaotusest. Konstantse juhusliku muutuja dispersioon on null ja dispersioon asukoha parameetri suhtes ei muutu.
Lisateave Covariance'i kohta
Statistilises teoorias on kovariants mõõdetav, kui palju kaks juhuslikku muutujat koos muutuvad. Teisisõnu on kovariatsioon kahe juhusliku muutuja vahelise korrelatsiooni tugevuse mõõt. Samuti võib seda pidada kahe juhusliku muutuja dispersioonikäsituse üldistamiseks.
Kahe juhusliku muutuja X ja Y, mis jagunevad lõpliku teise hooga, kovariatsiooni nimetatakse σXY= E [(X-E [X]) (Y-E [Y])]. Sellest lähtuvalt võib dispersiooni vaadelda kovariatsiooni erijuhuna, kus kaks muutujat on samad. Cov (X, X) = Var (X)
Kovariandi normaliseerimisega saadakse lineaarne korrelatsioonikordaja või Pearsoni korrelatsioonikordaja, mis on defineeritud kui ρ = E [(X-E [X]) (Y-E [Y])] / (σX σY ) = (Cov (X, Y)) / (σX σY)
Graafiliselt võib andmepunktide paari vahelist kovariatsiooni vaadelda ristküliku pindalana, kus andmepunktid asuvad vastaskülgedel. Seda võib tõlgendada kahe andmepunkti eraldamise ulatuse mõõtmena. Arvestades kogu elanikkonna ristkülikuid, võib eraldumise tugevuseks pidada kõikidele andmepunktidele vastavate ristkülikute kattumist; kahe muutuja dispersioon. Kovariants on kahe muutuja tõttu kahes dimensioonis, kuid selle lihtsustamisel ühele muutujale antakse üksiku dispersioon, kuna eraldumine ühes dimensioonis.
Mis vahe on variatsioonil ja kovariantsil??
• Variatsioon on populatsiooni leviku / hajuvuse mõõt, samal ajal kui kovariatsiooni peetakse kahe juhusliku muutuja variatsiooni või korrelatsiooni tugevuse mõõdupuuks.
• Variatsiooni võib pidada kovariatsiooni erijuhuks.
• dispersioon ja kovariatsioon sõltuvad andmeväärtuste suurusest ja neid ei saa võrrelda; seetõttu on need normaliseeritud. Kovariatsioon normaliseeritakse korrelatsioonikordajaks (jagades kahe juhusliku muutuja standardhälbe korrutisega) ja dispersioon normaliseeritakse standardhälbeks (ruutjuure võtmise teel)