Erinevus standardhälbe ja standardvea vahel

Sissejuhatus

Standard Dkõrvalekalle (SD) ja Standardne Ehirm (SE) on pealtnäha sarnased terminoloogiad; siiski on nad kontseptuaalselt nii mitmekesised, et neid kasutatakse statistikakirjanduses peaaegu vaheldumisi. Mõlemale terminile eelneb tavaliselt pluss-miinus sümbol (+/-), mis näitab, et need määratlevad sümmeetrilise väärtuse või tähistavad väärtuste vahemikku. Alati kuvatakse mõlemad mõisted mõõdetud väärtuste kogumi keskmise (keskmise) väärtusega.

Huvitav on see, et SE-l pole midagi pistmist standardite, vigade ega teaduslike andmete edastamisega.

SD ja SE päritolu üksikasjalik ülevaade ning nende selgitus näitab, miks kutselised statistikud ja need, kes kasutavad seda nõnda, kipuvad mõlemad eksima.

Standardhälve (SD)

SD on a kirjeldav statistika, mis kirjeldab jaotuse levikut. Mõõturina on see kasulik siis, kui andmeid levitatakse tavaliselt. See on aga vähem kasulik, kui andmed on väga viltu või bimodaalsed, kuna see ei kirjelda jaotuse kuju väga hästi. Tavaliselt kasutame valimi tunnuste teatamisel SD-d, sest me kavatseme seda teha kirjeldada kui palju andmed keskmise kohta varieeruvad. Muud kasulikud statistilised andmed andmete leviku kirjeldamiseks on kvartiilidevaheline vahemik, 25. ja 75. protsentiil ning andmete vahemik.

Joonis 1. SD on andmete leviku mõõt. Kui andmed on tavaliselt jaotunud jaotuse valim, eeldatakse, et kaks kolmandikku andmetest jääb keskmise keskväärtuse 1 standardhälbe piiridesse..

Variatsioon on a kirjeldav statistika ja see on määratletud kui standardhälbe ruut. Tulemuste kirjeldamisel seda tavaliselt ei esitata, kuid see on matemaatiliselt paremini jälgitav valem (nt ruuthälvete summa) ja mängib rolli statistika arvutamisel.

Näiteks kui meil on kaks statistikat Lk & Q teadaolevate erinevustega var(P) & var(Q), siis summa dispersioon P + Q võrdub dispersioonide summaga: var(P) +var(Q). Nüüd on ilmne, miks statistikutele meeldib dispersioonidest rääkida.

Kuid standardhälvetel on oluline leviku tähendus, eriti kui andmeid levitatakse tavaliselt: intervalli keskmine +/ - 1 SD võib eeldada, et see hõivab 2/3 proovist ja intervalli keskmine +- 2 SD võib eeldada, et see moodustab 95% valimist.

SD näitab, kui palju individuaalsed vastused küsimusele erinevad või "kalduvad" keskmisest. SD räägib uurijale, kui vastused on hajutatud - kas need on koondunud keskpunkti või on hajutatud kaugele ja laiali? Kas kõik teie vastajad hindasid teie toodet teie skaala keskel või kas mõni kiitis selle heaks ja mõni mitte?

Mõelge katsele, kus vastajatel palutakse toodet hinnata atribuutide seeria järgi 5-pallisel skaalal. Kümnest vastajast koosneva rühma (allpool tähistatud A-st läbi J-i) keskmine "hea raha eest" oli 3,2, SD SD-ga 0,4 ja toote usaldusväärsuse keskmine 3,4, SD SD-ga 2,1.

Esmapilgul (vaadates ainult vahendeid) näib, et usaldusväärsust hinnati väärtusest kõrgemaks. Kuid kõrgem usaldusväärsuse SD võib näidata (nagu on näidatud allolevas jaotuses), et vastused olid väga polariseeritud, kus enamikul vastajatest ei olnud usaldusväärsusega probleeme (hindas atribuuti 5), kuid väiksemal, kuid olulisel osal vastajatest oli usaldusväärsuse probleem ja hindas atribuuti “1”. Ainuüksi keskmise vaatlusega jutustatakse ainult osa loost, kuid enamasti keskenduvad sellele uurijad. Vastuste jaotust on oluline arvestada ja SD on sellest väärtuslik kirjeldav mõõdik.

Vastaja Hea hinna ja kvaliteedi suhe Toote töökindlus
A 3 1
B 3 1
C 3 1
D 3 1
E 4 5
F 4 5
G 3 5
H 3 5
Mina 3 5
J 3 5
Tähendab 3.2 3.4
Std. Dev. 0,4 2.1

Esimene uuring: vastajad hindasid toodet 5-palli skaalal

Kaks väga erinevat vastuste jaotust 5-pallisel skaalal võivad anda sama keskmise. Vaatleme järgmist näidet, mis näitab kahe erineva reitingu vastuseväärtusi.

Esimeses näites (hinnang “A”) on SD null, kuna KÕIK vastused olid täpselt keskmise väärtusega. Individuaalsed vastused ei kaldunud üldse keskmisest kõrvale.

Reitingu „B” korral, isegi kui rühma keskmine on sama (3.0) kui esimesel jaotusel, on standardhälve suurem. Standardhälve 1,15 näitab, et üksikud vastused keskmiselt * olid keskmisest veidi üle 1 punkti kaugusel.

Vastaja Hinnang A Hinnang „B”
A 3 1
B 3 2
C 3 2
D 3 3
E 3 3
F 3 3
G 3 3
H 3 4
Mina 3 4
J 3 5
Tähendab 3.0 3.0
Std. Dev. 0,00 1.15

Teine uuring: vastajad hindasid toodet 5-palli skaalal

Veel üks viis SD-i vaatamiseks on vastuste histogrammina jaotuse joonistamine. Madala SD-ga jaotus kuvatakse kõrge kitsa kujuga, suurt SD-d aga laiema kujuga.

SD ei tähista üldiselt "õiget või vale" ega "paremat või halvemat" - madalam SD ei ole tingimata soovitavam. Seda kasutatakse puhtalt kirjeldava statistikana. See kirjeldab jaotust keskmise suhtes.

TSD-ga seotud tehniline vastutusest loobumine

SD-i kui keskmise hälbe mõtestamine on suurepärane viis selle tähenduse kontseptuaalseks mõistmiseks. Seda ei arvutata aga tegelikult keskmisena (kui oleks, siis nimetaksime seda “keskmiseks hälbeks”). Selle asemel on see “standardiseeritud”, mõnevõrra keeruline meetod väärtuse arvutamiseks, kasutades ruutude summat.

Praktilistel eesmärkidel pole arvutamine oluline. Enamik tabeli programme, arvutustabeleid või muid andmehaldusvahendeid arvutab SD teie jaoks. Veel olulisem on mõista, mida statistika edastab.

Tavaline viga

Tavaline viga on järelduslik statistika, mida kasutatakse valimi keskmiste (keskmiste) võrdlemisel populatsioonide lõikes. See on mõõdupuu täpsus valimi keskmisest. Valimi keskmine on statistika, mis tuletatakse andmetest, millel on aluseks olev jaotus. Me ei saa seda visualiseerida samamoodi nagu andmeid, kuna oleme teinud ühe katse ja meil on ainult üks väärtus. Statistiline teooria ütleb, et valimi keskmine (suure „piisavalt“ valimi korral ja väheste korrapärasuse tingimustes) jaotub ligikaudu normaalselt. Selle normaaljaotuse standardhälvet nimetatakse standardveaks.

Joonis 2. Jaotus allosas vastabnäitab andmete jaotust, ülaosas jaotus on valimi keskmise teoreetiline jaotus. SD 20 on andmete leviku mõõt, samas kui SE 5 on mõõtemääramatuse mõõt valimi keskmise ümber.

Kui tahame võrrelda ravi A ja ravi B kahe valimi eksperimendi tulemuste keskmisi, peame hindama, kui täpselt oleme keskmisi mõõtnud.

Tegelikult huvitab meid, kui täpselt oleme kahe vahendi erinevust mõõtnud. Me nimetame seda mõõdetud erinevuse standardveaks. Te ei pruugi olla üllatunud, kui näete, et näidisvahendite erinevuste standardviga on vahendite standardvigade funktsioon:

Nüüd, kui olete aru saanud, et keskmise standardviga (SE) ja jaotuse standardhälve (SD) on kaks erinevat looma, siis võite küsida, kuidas nad kõigepealt segadusse läksid. Ehkki nad erinevad kontseptuaalselt, on neil matemaatiliselt lihtne seos:

,kus n on andmepunktide arv.

Pange tähele, et standardviga sõltub kahest komponendist: valimi standardhälve ja valimi suurus n. See on intuitiivne: mida suurem on valimi standardhälve, seda vähem täpsed võime olla meie tegeliku keskmise hinnangu kohta.

Ka mida suurem on valimi suurus, seda rohkem on meil andmeid rahvaarvu kohta ja mida täpsemalt saame selle tegelikku keskmist hinnata.

SE on näitaja keskmise usaldusväärsuse kohta. Väike SE on märk sellest, et valimi keskmine kajastab tegeliku populatsiooni keskmist täpsemini. Suurema valimi korral saadakse tavaliselt väiksem SE (samal ajal kui valimi suurus SD-d otseselt ei mõjuta).

Enamik uuringuuuringuid hõlmab valimi moodustamist elanikkonnast. Seejärel teeme sellest valimist saadud tulemuste põhjal järeldused populatsiooni kohta. Kui võetaks teine ​​proov, ei vasta tulemused tõenäoliselt täpselt esimesele proovile. Kui reitingu tunnuse keskmine väärtus oli ühe valimi kohta 3,2, võib sama suurusega teise valimi korral olla see 3,4. Kui peaksime oma populatsioonist võtma lõpmatu arvu (võrdse suurusega) proove, saaksime vaadeldavaid keskmisi kuvada jaotusena. Seejärel saaksime arvutada kõigi meie valimi keskmiste väärtuste keskmised. See keskmine võrduks tegeliku rahvaarvu keskmisega. Samuti saame arvutada valimi keskmiste jaotuse SD. Selle valimi keskmiste jaotuse SD on iga üksiku valimi keskmise SE.

Seega on meil kõige olulisem tähelepanek: SE on elanikkonna keskmise SD.

Proov Tähendab
1. 3.2
2 3.4
3 3.3
4 3.2
5 3.1
… . … .
… . … .
… . … .
… . … .
… . … .
Tähendab 3.3
Std. Dev. 0,13

SD ja SE suhet illustreeriv tabel

Nüüd on selge, et kui selle jaotuse SD aitab meil mõista, kui kaugel valimi keskmine on tegeliku populatsiooni keskmisest, siis saame selle abil mõista, kui täpne on iga üksiku valimi keskmine tegeliku keskmise suhtes. See on SE olemus.

Tegelikult oleme oma elanikkonnast võtnud ainult ühe valimi, kuid selle tulemuse abil saame anda hinnangu meie vaadeldud valimi keskmise usaldusväärsuse kohta.

Tegelikult ütleb SE meile, et võime olla 95% kindlad, et meie vaadeldud valimi keskmine on pluss või miinus umbkaudu 2 (tegelikult 1,96) Standardvead populatsiooni keskmisest.

Allpool olev tabel näitab meie uurimistööks kasutatud esimese (ja ainsa) valimi vastuste jaotust. SE 0,13, mis on suhteliselt väike, annab meile märku, et meie keskmine on suhteliselt lähedal kogu elanikkonna tegelikule keskmisele. Meie keskmise veamarginaal (95% usaldusnivool) on (umbes) sellest väärtusest kaks korda suurem (+/- 0,26), mis ütleb meile, et tegelik keskmine on kõige tõenäolisem vahemikus 2,94 kuni 3,46.

Vastaja Hinnang
A 3
B 3
C 3
D 3
E 4
F 4
G 3
H 3
Mina 3
J 3
Tähendab 3.2
Std. Eks 0,13

Kokkuvõte

Paljud teadlased ei mõista standardhälbe ja standardvea erinevust, isegi kui neid kaasatakse tavaliselt andmete analüüsi. Ehkki tegelikud standardhälbe ja standardvea arvutused näevad välja väga sarnased, esindavad nad kahte väga erinevat, kuid üksteist täiendavat meedet. SD räägib meile meie jaotuse kuju kohta, kui lähedased on üksikute andmete väärtused keskväärtusest. SE ütleb meile, kui lähedane on meie valimi keskmine kogu rahvaarvu tegelikule keskmisele. Üheskoos aitavad need saada terviklikuma pildi, kui ainuüksi keskmine meile öelda suudab.