Standardhälve ja dispersioon on statistilised mõõtmistulemid
Standardhälbe ja dispersiooni valemit väljendatakse sageli järgmiselt:
Komplekti dispersioon n sama tõenäolised väärtused võib kirjutada järgmiselt:
Standardhälve on dispersiooni ruutjuur:
Kreeka tähtedega valemitel võib olla hirmutav, kuid see on vähem keeruline kui tundub. Lihtsamalt öeldes:
See annab variatsiooni. Standardhälbe leidmiseks võtke dispersiooni ruutjuur.
See Khan Akadeemia suurepärane video selgitab dispersiooni ja standardhälbe mõisteid:
Oletame, et andmekogum sisaldab kuue võilille kõrgust: 3 tolli, 4 tolli, 5 tolli, 4 tolli, 11 tolli ja 6 tolli.
Esiteks leidke andmepunktide keskmine: (3 + 4 + 5 + 4 + 11 + 7) / 6 = 5,5
Nii et keskmine kõrgus on 5,5 tolli. Nüüd vajame kõrvalekaldeid, seega leiame iga taime erinevuse keskmisest: -2,5, -1,5, -,5, -1,5, 5,5, 1,5
Nüüd ruuduke iga kõrvalekalle ruutudeks ja leidke nende summa: 6,25 + 2,25 + .25 + 2,25 + 30,25 + 2,25 = 43,5
Jagage ruutude summa andmepunktide arvuga, antud juhul taimede korral: 43,5 / 6 = 7,25
Seega on selle andmekogumi dispersioon 7,25, mis on üsna suvaline arv. Selle teisendamiseks reaalmaailma mõõtmiseks võtke ruutjuur 7,25, et leida standardhälve tollides.
Standardhälve on umbes 2,69 tolli. See tähendab, et proovi puhul on iga võilill keskmiselt 2,69 tolli (5,5 tolli) täpsusega “normaalne”.
Kõrvalekalded on ruudus, et vältida negatiivsete väärtuste (keskmisest väiksemate kõrvalekallete) positiivsete väärtuste tühistamist. See töötab, kuna negatiivse arvu ruut muutub positiivseks. Kui teil oleks lihtne andmekogum, mille kõrvalekalded keskmistest on +5, +2, -1 ja -6, siis tuleb väärtuste ruutudeta ruumala (st 5 + 2 - 1) korral kõrvalekallete summa nulliks. - 6 = 0).
Variatsiooni väljendatakse matemaatilise dispersioonina. Kuna see on suvaline arv võrreldes andmekogumi algsete mõõtmetega, on seda reaalajas raske visualiseerida ja rakendada. Variandi leidmine on tavaliselt alles viimane samm enne standardhälbe leidmist. Variatsiooniväärtusi kasutatakse mõnikord rahanduses ja statistilistes valemites.
Standardhälve, mida väljendatakse andmekogumi algühikutes, on palju intuitiivsem ja lähemal algse andmekogumi väärtustele. Kõige sagedamini kasutatakse seda demograafiliste andmete või rahvastikuproovide analüüsimiseks, et saada ülevaade sellest, mis on populatsioonis normaalne.
Normaalse jaotuse korral jääb umbes 68% elanikkonnast (või väärtustest) keskväärtuse 1 standardhälbe (1σ) piiridesse ja umbes 94% 2σ vahemikku. Väärtusi, mis erinevad keskmisest 1,7σ või rohkem, loetakse tavaliselt välisväärtusteks.
Praktikas üritavad kvaliteedisüsteemid nagu Six Sigma vähendada vigade määra, nii et vead muutuksid kõrvaliseks. Mõiste "kuus sigmaprotsessi" pärineb arusaamast, et kui protsessi keskväärtuse ja lähima spetsifikatsiooni piirmäära vahel on kuus standardhälvet, ei vasta praktiliselt ükski üksus spetsifikatsioonidele.[1]
Reaalsetes rakendustes esindavad kasutatavad andmekogumid enamasti kogu populatsioone, mitte populatsiooni valimeid. Osalise valimi põhjal järelduste tegemiseks kogu populatsiooni kohta kasutatakse pisut muudetud valemit.
'Valiku standardhälvet' kasutatakse juhul, kui teil on ainult valim, kuid soovite avalduse selle populatsiooni standardhälbe kohta, millest valim võetakse.
Ainus viis, kuidas proovi standardhälbe valem erineb standardhälbe valemist, on nimetaja tähis “-1”.
Võilille näite abil oleks seda valemit vaja, kui võtaksime proovid ainult 6 võilille kohta, kuid sooviksime seda proovi kasutada kogu põllu jaoks standardhälbe määramiseks sadade võilillide korral.
Ruutude summa jagatakse nüüd 6 (n - 1) asemel 5-ga, mis annab dispersiooniks 8,7 (7,25 asemel) ja proovi standardhälve on 2,95 tolli, algse standardhälbe asemel 2,69 tolli. Seda muudatust kasutatakse veamarginaali leidmiseks valimis (antud juhul 9%).