Regressioon vs ANOVA
Regressioon ja ANOVA (variatsioonianalüüs) on statistilises teoorias kaks meetodit ühe muutuja käitumise analüüsimiseks teisega. Regressioonis on see sageli sõltuva muutuja variatsioon, mis põhineb sõltumatul muutujal, ANOVA puhul on see kahest populatsioonist koosneva kahe proovi atribuutide variatsioon.
Lisateavet regressiooni kohta
Regressioon on statistiline meetod, mida kasutatakse kahe muutuja vahelise seose leidmiseks. Sageli võib andmete kogumisel olla muutujaid, mis sõltuvad teistest. Nende muutujate täpset seost saab kindlaks teha ainult regressioonimeetoditega. Selle suhte määramine aitab mõista ja ennustada ühe muutuja käitumist teisele.
Regressioonanalüüsi kõige tavalisem rakendus on sõltuva muutuja väärtuse hindamine antud väärtuse või sõltuvate muutujate väärtuste vahemiku jaoks. Näiteks regressiooni abil saame juhuslikust valimist kogutud andmete põhjal kindlaks teha kauba hinna ja tarbimise suhte. Regressioonianalüüs annab andmekogumile regressioonifunktsiooni, mis on matemaatiline mudel, mis sobib olemasolevate andmetega kõige paremini. Seda saab hõlpsalt tähistada hajuvusega. Graafiline regressioon on samaväärne andmekogumile sobivaima kõvera leidmisega. Kõvera funktsioon on regressioonifunktsioon. Matemaatilist mudelit kasutades saab kauba hinna ennustada antud hinnaga.
Seetõttu kasutatakse regressioonanalüüsi laialdaselt ennustamisel ja prognoosimisel. Seda kasutatakse ka suhete loomiseks eksperimentaalsetes andmetes, füüsika, keemia ning paljude loodus- ja tehnikateaduste alal. Kui suhe või regressioonifunktsioon on lineaarne funktsioon, siis nimetatakse seda protsessi lineaarseks regressiooniks. Hajumisel võib seda kujutada sirgjoonena. Kui funktsioon ei ole parameetrite lineaarne kombinatsioon, siis on regressioon mittelineaarne.
Lisateave ANOVA (dispersioonanalüüsi) kohta
ANOVA ei hõlma kahe või enama muutuja vahelise seose selgesõnalist analüüsi. Pigem kontrollitakse, kas kahel või enamal eri populatsioonidest võetud proovil on sama keskmine. Mõelge näiteks koolis klassile korraldatud eksami testi tulemustele. Ehkki testid on erinevad, võivad sooritusnäitajad klassiti erineda. Üks viis selle kontrollimiseks on võrrelda iga klassi vahendeid. ANOVA või variatsioonianalüüs võimaldab seda hüpoteesi kontrollida. Põhimõtteliselt võib ANOVA-d pidada t-testi pikenduseks, kus võrreldakse kahest populatsioonist võetud kahe proovi keskmisi.
ANOVA põhiidee on kaaluda valimisiseseid erinevusi ja varieerumist. Valimis esinevat varieeruvust võib seostada juhuslikkusega, samas kui valimi vahelist varieerumist võib seostada nii juhuslikkusega kui ka muude väliste teguritega. Dispersiooni analüüs põhineb kolmel mudelil; fikseeritud efektide mudel, juhuslike efektide mudel ja segaefektide mudel.
Mis vahe on regressioonil ja ANOVAl??
• ANOVA on kahe või enama proovi vahelise variatsiooni analüüs, regressioon on kahe või enama muutuja vahelise seose analüüs..
• ANOVA teooriat rakendatakse kasutades kolme põhimudelit (fikseeritud efektide mudel, juhuslike efektide mudel ja segaefektide mudel), samal ajal kui regressiooni rakendatakse kasutades kahte mudelit (lineaarse regressiooni mudel ja mitme regressiooni mudel).
• ANOVA ja regressioon on mõlemad üldise lineaarse mudeli (GLM) kaks versiooni. ANOVA põhineb kategoorilistel ennustajamuutujatel, regressioon põhineb kvantitatiivsetel ennustajamuutujatel.
• Regressioon on paindlikum tehnika ja seda kasutatakse prognoosimisel ja ennustamisel, samal ajal kui ANOVA-d kasutatakse kahe või enama populatsiooni võrdsuse võrdlemiseks..