Nii korrelatsioon kui ka regressioon on statistilised tööriistad, mis käsitlevad kahte või enamat muutujat. Ehkki mõlemad on seotud ühe ja sama teemaga, on nende kahe vahel erinevusi. Allpool selgitatakse nende kahe erinevusi.
Mõiste korrelatsioon kahe või enama muutujaga viitab sellele, et muutujad on mingil viisil seotud. Korrelatsioonianalüüs määrab kindlaks, kas kahe muutuja vahel on seos, ja suhte tugevuse. Kui kaks muutujat x (sõltumatu) ja y (sõltuv) on omavahel seotud, nii et sõltumatu muutuja suuruse muutumisega kaasneb sõltuva muutuja suuruse muutumine, siis öeldakse, et kaks muutujat on korrelatsioonis.
Korrelatsioon võib olla lineaarne või mittelineaarne. Lineaarne korrelatsioon on selline, kus muutujad on nii seotud, et ühe muutuja väärtuse muutus põhjustaks järjepidevalt teise muutuja väärtuse muutuse. Lineaarses korrelatsioonis koonduksid sõltuvate ja sõltumatute muutujate vastavate väärtustega seotud hajutatud punktid mittehorisontaalse sirgjoone ümber, ehkki horisontaalne sirge näitaks ka muutujate vahelist lineaarset suhet, kui sirge võiks ühendada punkte, mis tähistavad sirget muutujad.
Regressioonianalüüs seevastu kasutab olemasolevaid andmeid muutujate vahelise matemaatilise seose määramiseks, mida saab kasutada sõltuva muutuja väärtuse määramiseks sõltumatu muutuja mis tahes väärtuse suhtes.
Korrelatsioon on seotud seose tugevuse või seose intensiivsuse mõõtmisega, kui regressioon on seotud sõltuva muutuja väärtuse ennustamisega sõltumatu muutuja teadaoleva väärtusega. Seda saab selgitada järgmiste valemitega.
Korrelatsioonikordaja või koefitsiendi korrelatsioon (r) x ja y vahel leitakse järgmise valemiga;
r = kovariatsioon (x, y) /σx.σy, cov (x, y) = Σxy / n - (Σx / n) (Σy / n), σx ja σy on vastavalt x ja y standardhälbed ja - 1 < r 0, then correlation coefficient between x and y = correlation coefficient between u and v.
Korrelatsioonikordaja r on puhasarv ja mõõtühikust sõltumatu. Seega, kui x on teatud piirkonna inimeste kõrgus (tollides) ja y on inimeste kaal (naela), siis r ei ole tolli ega naela, vaid lihtsalt arv.
Regressioonivõrrand leitakse järgmise valemi abil;
Y-i regressioonivõrrand x-il (y-hinnangu väljaselgitamiseks) on y - y '= byx (x-x‾), byx nimetatakse y-i regressioonikordajaks x-il. X-i regressioonivõrrand y-l (x-i leidmiseks) on x - x '= bxy (y-y‾), bxy-d nimetatakse y-i regressioonikordajaks y-l.
Korrelatsioonianalüüs ei eelda ühegi muutuja sõltuvust teisest muutujast, samuti ei püüta välja selgitada nende vahelist suhet. See hindab lihtsalt muutujate vahelist seotuse astet. Teisisõnu testib korrelatsioonianalüüs muutujate vastastikust sõltuvust. Regressioonianalüüs kirjeldab teiselt poolt sõltuva muutuja või reageerimismuutuja sõltuvust sõltumatust või selgitavast muutujast. Regressioonanalüüs eeldab, et selgitavate ja reageerimismuutujate vahel on ühesuunaline põhjuslik seos, ning ei võeta arvesse, kas see põhjuslik seos on positiivne või negatiivne. Korrelatsiooni jaoks on nii sõltuvate kui ka sõltumatute muutujate väärtused juhuslikud, kuid sõltumatute muutujate regressiooniväärtused ei pea olema juhuslikud.
1. Korrelatsioonianalüüs on kahe muutuja omavahelise sõltuvuse test. Regressioonanalüüs annab matemaatilise valemi sõltuva muutuja väärtuse määramiseks sõltumatu muutuja (te) väärtuse suhtes.
2. Korrelatsioonikordaja ei sõltu päritolu ja ulatuse valikust, kuid regressioonikordaja ei ole nii.
Korrelatsiooni jaoks peavad mõlema muutuja väärtused olema juhuslikud, kuid regressioonikordaja puhul see pole nii.
1. Das, N. G., (1998), Statistics Methods, Calcutta
2. Korrelatsioon ja regressioon, saadaval aadressil www.le.ac.uk/bl/gat/virtualfc/stats/regression
3. Regressioon ja korrelatsioon, saadaval aadressil www.abyss.uoregon.edu