Valimi ja populatsiooni dispersiooni erinevus

Seletus

Statistikas tähistab termin valimite koostamine statistiliste andmete koondandmete osa valimist, et saada kogu kohta asjakohast teavet. Statistilist teavet tervikuna või tervikuna kõigi uurimisega hõlmatud liikmete konkreetse iseloomu kohta nimetatakse rahvastikuks või universumiks. (Das, N. G., 2010). Populatsiooni valitud osa, mida kasutatakse populatsiooni või universumi omaduste saamiseks, nimetatakse „valimiks”. Kogum moodustatakse üksikutest ühikutest või liikmetest ning osa ühikutest moodustatakse valimis. Populatsiooni ühikute koguarvu nimetatakse populatsiooni suuruseks ja valimi ühikut nimetatakse valimi suuruseks. Populatsioon ja valim võivad olla piiratud või lõpmatud ning sarnaselt võivad nad olla eksisteerivad või hüpoteetilised.

Variatsioon: Variatsioon on arvväärtus, mis näitab, kui laialt jaotuvad üksikud andmekogude arvud keskmise kohta. See tähendab, kui kaugel on iga arv keskmisest ja seega üksteisest. Nullväärtuse dispersioon tähendab, et kõik andmed on identsed. Mida suurem on dispersioon, seda rohkem on väärtused keskmisest, seega üksteisest jaotatud. Mida vähem on dispersioon, seda vähem on väärtused keskmiselt, seega üksteisest jaotatud, ja dispersioon ei saa olla negatiivne.

Erinevus populatsiooni ja valimi variatsioonide vahel

Peamine erinevus populatsiooni ja valimi dispersiooni vahel on seotud dispersiooni arvutamisega. Variatsioon arvutatakse viies etapis. Kõigepealt arvutatakse keskmine, siis arvutatakse kõrvalekalded keskmisest ja kolmandaks jagatakse kõrvalekalded ruudus, neljandaks summeeritakse ruutkeskmised hälbed ja lõpuks jagatakse see summa üksuste arvuga, mille jaoks dispersioon arvutatakse. Seega dispersioon = Σ (xi-x -) / n. Kus xi = i. Arv, x- = keskmine ja n = ühikute arv ...

Kui dispersioon tuleb arvutada rahvaarvu andmete põhjal, on n võrdne üksuste arvuga. Seega, kui kõigi 1000 inimese vererõhu erinevus tuleb arvutada kõigi 1000 inimese vererõhu andmete põhjal, siis n = 1000. Kui aga dispersioon arvutatakse proovide andmete põhjal, tuleb enne n-ö jagamist n-st lahutada n ruuthälvete summa. Seega kui ülaltoodud näites on valimi andmetel 100 ühikut, oleks nimetaja 100 - 1 = 99.

Seetõttu on valimi andmete põhjal arvutatud dispersiooniväärtus suurem kui väärtus, mille oleks võinud populatsiooni andmeid kasutades teada saada. Selle tegemise loogika on kompenseerida meie teabe puudus rahvastiku kohta. Inimeste kõrguse varieeruvust on võimatu välja selgitada, kuna meil puudub täielik teave kõigi elavate inimeste kõrguste kohta, tulevikust rääkimata. Isegi kui võtame ühe mõõduka näite, nagu näiteks USA kõigi elavate meeste pikkuse kohta käivad andmed rahvaarvu kohta, on see füüsiliselt võimalik, kuid sellega kaasnevad kulud ja aeg läheksid selle arvutamise eesmärki ületama. See on põhjus, miks valimi andmeid võetakse enamikul statistilistel eesmärkidel, ja sellega kaasneb teabe puudumine enamiku andmete kohta. Selle kompenseerimiseks on dispersiooniväärtus ja standardhälve, mis on dispersiooni tüvi ruut, valimi andmete korral suurem kui dispersioon populatsiooni andmete põhjal.

See toimib analüütikute ja otsustajate jaoks automaatse kilbina. Loogika kehtib otsuste tegemisel kapitali eelarvestamise, isikliku ja ettevõtluse finantseerimise, ehituse, liikluse korraldamise ja paljude muude kohaldatavate valdkondade kohta. See aitab sidusrühmal olla otsuse tegemise või muude järelduste tegemisel ohutul positsioonil.

Kokkuvõte: Populatsiooni dispersioon tähendab dispersiooni väärtust, mis arvutatakse populatsiooni andmete põhjal, ja valimi dispersioon on dispersioon, mis on arvutatud valimi andmete põhjal. Selle nimetaja väärtuse tõttu on dispersioonvalemi valemiandmete korral n-1 ja populatsiooni andmete puhul n. Selle tulemusel on nii valimi andmetest tuletatud dispersioon kui ka standardhälve suurem kui populatsiooni andmetest selgus.