Keskne tendents vs hajutatus
Kirjeldavas ja järeldavas statistikas kasutatakse andmekogumi kirjeldamiseks, mis vastab selle kesksele kalduvusele, hajutatusele ja vildakusele, mitu indeksit: kolm kõige olulisemat omadust, mis määravad andmekogumi jaotuse suhtelise kuju.
Mis on keskne tendents?
Keskne tendents viitab ja paikneb väärtuste jaotuse keskpunkti. Keskmine, režiim ja mediaan on andmekogumi keskse tendentsi kirjeldamisel kõige sagedamini kasutatavad indeksid. Kui andmekogum on sümmeetriline, siis langevad nii andmekogumi mediaan kui ka keskmine kokku.
Andmekogumi korral arvutatakse keskmine, võttes kõigi andmeväärtuste summa ja jagades selle seejärel andmete arvuga. Näiteks mõõdetakse 10 inimese kaaluks (kilogrammides) 70, 62, 65, 72, 80, 70, 63, 72, 77 ja 79. Siis võib kümne inimese keskmine kaal (kilogrammides) olla arvutatakse järgmiselt. Kaalude summa on 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710. Keskmine = (summa) / (andmete arv) = 710/10 = 71 (kilogrammides). Arusaadavalt mõjutavad keskmist väärtused (tavalisest trendist erinevad andmepunktid). Seega ei anna keskväärtuste olemasolul ainuüksi keskmine andmestiku keskmest õiget pilti.
Mediaan on andmepunkt, mis asub andmekogumi täpses keskel. Üks viis mediaani arvutamiseks on järjestada andmepunktid kasvavas järjekorras ja seejärel leida andmepunkt keskel. Näiteks kui eelmine andmekogum on kord tellitud, näeb see välja näiteks 62, 63, 65, 70, 70, 72, 72, 77, 79, 80. Seetõttu on (70 + 72) / 2 = 71 keskel. Sellest järeldub, et mediaan ei pea olema andmekogumis. Kõrvalekallete olemasolu mediaani ei mõjuta. Seega saab mediaan keskväärtuse paremaks mõõtmiseks kõrvalekallete olemasolul.
Režiim on andmekogumis kõige sagedamini esinev väärtus. Eelmises näites esinevad mõlemad väärtused 70 ja 72 kaks korda ja seega on mõlemad režiimid. See näitab, et mõnes jaotuses on rohkem kui üks modaalne väärtus. Kui on ainult üks režiim, siis öeldakse, et andmekogum on ühemodaalne, sel juhul on andmekogum kaheliigiline.
Mis on hajuvus?
Dispersioon on leviku keskpunkti kohta levivate andmete hulk. Hajuvusmõõtmed on kõige sagedamini kasutatavad vahemik ja standardhälve.
Vahemik on lihtsalt suurim väärtus miinus madalaim väärtus. Eelmises näites on kõrgeim väärtus 80 ja madalaim väärtus 62, seega vahemik on 80–62 = 18. Kuid vahemik ei anna hajuvuse kohta piisavat pilti.
Standardhälbe arvutamiseks arvutatakse kõigepealt andmeväärtuste hälbed keskmisest. Hälvete ruutkeskmist nimetatakse standardhälbeks. Eelmises näites on vastavad kõrvalekalded keskmisest: (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 ja (79 - 71) = 8. kõrvalekalde ruudud on (-1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1)2 + (-8)2 + 12 + 62 + 82 = 366. Standardhälve on √ (366/10) = 6,05 (kilogrammides). Kui andmekogum pole suuresti viltu, võib sellest järeldada, et suurem osa andmetest on vahemikus 71 ± 6.05, ja selles konkreetses näites on see tõepoolest nii..
Mis vahe on tsentraalse kalduvuse ja hajutatuse vahel?? • Keskne tendents osutab ja paikneb väärtuste jaotuse keskpunkti • Hajumine on andmete levik andmekogu keskpunkti kohta.
|