Kategoorilised andmed vs numbrilised andmed
Andmed on faktid või teave, mis on kogutud viitamise või analüüsi jaoks. Sageli kogutakse neid andmeid asjaomase subjekti atribuudina. See atribuut võib varieeruda, seetõttu võib seda varieeruvat atribuuti pidada muutujaks. Muutujad võivad eeldada väärtuste erinevat vormi ja need on kogutud andmetes olemuslikud.
Muutujad võivad olla kas kvalitatiivsed või kvantitatiivsed; st kui muutuja on kvantitatiivne, on vastused numbrid ja mõõdetud tunnuse suuruse saab teatava täpsusega öelda. Teist tüüpi kvalitatiivsed muutujad mõõdavad kvalitatiivseid tunnuseid ja muutujate eeldatavaid väärtusi ei saa suuruse ega ulatuse osas anda. Muutujaid ennast nimetatakse kategoorilisteks muutujateks ja kategoorilise muutuja abil kogutud andmed on kategoorilised andmed.
Lisateave numbriliste andmete kohta
Numbrilised andmed on põhimõtteliselt muutujast saadud kvantitatiivsed andmed ja väärtusel on suurus / suurusjärk. Saadud numbrilised andmed jagunevad Stanley Smith Stevensi väljatöötatud teooria põhjal veel kolme kategooriasse. Numbrilised andmed võivad olla kas tavalised, intervalli või suhtega. Andmete tüüp määratakse väärtuste mõõtmismeetodi abil ja neid tüüpe nimetatakse mõõtetasemeteks.
Numbriliste andmete näide on inimese kaal, kahe punkti vaheline kaugus, temperatuur ja aktsia hind.
Statistikas on suurem osa meetodeid saadud arvandmete analüüsiks. Numbriliste andmete analüüsimisel kasutatakse peamiselt kirjeldavat statistikat ja regressiooni ning muid järeldamismeetodeid.
Lisateave kategooriliste andmete kohta
Kategoorilised andmed on kvalitatiivse muutuja väärtused, sageli arv, sõna või sümbol. Need toovad välja asjaolu, et muutuja kuulub vaatlusalusel juhul ühte mitmest võimalikust valikust. Seetõttu kuuluvad nad ühte kategooriasse; seega nimi kategooriline.
Kvalitatiivsed atribuudid on inimese poliitiline kuuluvus, inimese rahvus, inimese lemmikvärv ja patsiendi veregrupp. Mõnikord võib arvu saada kategoorilise väärtusena, kuid number ise ei tähista mõõdetud tunnuse suurust. Postiindeks on üks näide.
Samuti kuuluvad kõik kategoorilised väärtused nominaalse andmetüübi alla, mis on teine tüüp, mis põhineb mõõtmiste tasemetel. Kategooriliste andmete analüüsimisel kasutatavad meetodid erinevad numbriliste andmete meetoditest, kuid aluspõhimõte võib olla sama.
Mis vahe on kategoorilistel ja numbrilistel andmetel??
• Numbrilised andmed on kvantitatiivse muutuja jaoks saadud väärtused ja nende suurusjärk on seotud muutuja kontekstiga (seega on need alati numbrid või numbrilise väärtusega sümbolid). Kategoorilised andmed on väärtused, mis saadakse kvalitatiivse muutuja jaoks; kategoorilised andmete numbrid ei anna suurust.
• Numbrilised andmed kuuluvad alati järjestik-, suhte- või intervalli tüüpi, samas kui kategoorilised andmed kuuluvad nominaalset tüüpi.
• Kvantitatiivsete andmete analüüsimiseks kasutatavad meetodid erinevad kategooriliste andmete jaoks kasutatavatest meetoditest, isegi kui põhimõtted on samad, vähemalt on rakendusel olulisi erinevusi.
• Numbrilisi andmeid analüüsitakse statistilisi meetodeid kasutades kirjeldava statistika, regressiooni, aegridade ja paljude teiste jaoks.
• Kategooriliste andmete puhul kasutatakse tavaliselt kirjeldavaid ja graafilisi meetodeid. Kasutatakse ka mõnda mitteparameetrilist testi.