Korrelatsioon vs kovariatsioon
Korrelatsioon ja kovariatsioon on teoreetilises statistikas tihedalt seotud mõisted. Need on olulised kahe juhusliku muutuja vahelise suhte määramisel.
Mis on korrelatsioon?
Korrelatsioon on kahe muutuja vahelise seose tugevuse mõõt. Korrelatsioonikoefitsient kvantifitseerib ühe muutuja muutumisastet teise muutuja muutuse põhjal. Statistikas on korrelatsioon seotud sõltuvuse mõistega, mis on kahe muutuja vaheline statistiline suhe
Pearsoni korrelatsioonikordaja või lihtsalt korrelatsioonikordaja r on väärtus vahemikus -1 kuni 1 (-1≤r≤ + 1). See on kõige sagedamini kasutatav korrelatsioonikordaja ja kehtib ainult muutujate vahelise lineaarse suhte korral. Kui r = 0, pole seost olemas ja kui r≥0, on suhe otseselt proportsionaalne; ühe muutuja väärtus suureneb teise suurenedes. Kui r≤0, on suhe pöördvõrdeline; üks muutuv langus, kui teine suureneb.
Lineaarsuse tingimuse tõttu saab korrelatsioonikordajat r kasutada ka muutujate vahelise lineaarse seose kindlakstegemiseks.
Mis on kovariatsioon?
Statistilises teoorias on kovariants mõõdetav, kui palju kaks juhuslikku muutujat koos muutuvad. Teisisõnu on kovariatsioon kahe juhusliku muutuja vahelise korrelatsiooni tugevuse mõõt.
Teisest küljest võib näha, et korrelatsioon on lihtsalt kovariatsiooni normaliseeritud versioon, kus kovariatsioon jagatakse kahe juhusliku muutuja standardhälbe korrutisega. Kovariatsiooni ulatus võib olla suur; seetõttu pole seda lihtne võrrelda. Sellest raskusest ületamiseks tuleb kovariatsiooni väärtused viia vahemikku, kus seda saab normaliseerida (näiteks nagu z-skoor teeb). Ehkki kovariatsioon ja dispersioon on üksteisega ülaltoodud viisil seotud, ei ole nende tõenäosusjaotused üksteisega lihtsalt ühendatud ja neid tuleb käsitleda eraldi.
Mis vahe on korrelatsioonil ja kovariantsil??
• Nii korrelatsioon kui ka kovariatsioon on kahe juhusliku muutuja vahelise seose mõõtmed. Korrelatsioon on kahe muutuja lineaarsuse tugevuse mõõt ja kovariatsioon on korrelatsiooni tugevuse mõõt..
• Korrelatsioonikoefitsiendi väärtused on väärtus vahemikus -1 kuni +1, kusjuures kovariatsiooni vahemik ei ole konstantne, kuid võib olla kas positiivne või negatiivne. Kuid kui juhuslikud muutujad on enne kovariandi arvutamist standardiseeritud, võrdub kovariatsioon korrelatsiooniga ja väärtus on vahemikus -1 kuni +1.