Klassifikatsioon ja ennustamine on kaks andmekaevandamisega seotud terminit. Andmed on kasumi suurendamiseks ja turu mõistmiseks olulised peaaegu kogu organisatsiooni jaoks. Tavalistel andmetel pole palju väärtust. Seetõttu tuleks andmeid kasuliku teabe saamiseks töödelda. Andmete kaevandamine on tehnoloogia, mis eraldab suure hulga andmetest teavet. See aitab saada andmetest laiemat arusaama. Mõned andmekaevandamise rakendused on turuanalüüs, tootmise kontroll ja pettuste tuvastamine. Klassifikatsioon ja prognoosimine on kaks andmete kaevandamisega seotud terminit. Selles artiklis käsitletakse klassifitseerimise ja ennustamise erinevust. Klassifikatsioon on uue vaatluse kategooria või klassimärgise tuvastamise protsess, millesse see kuulub. Ennustamine on puuduvate või kättesaamatute arvandmete tuvastamine uue vaatluse jaoks. See on see võtme erinevus klassifitseerimine ja ennustamine. Ennustus ei puuduta klassimärgist nagu klassifitseerimisel.
1. Ülevaade ja peamised erinevused
2. Mis on klassifikatsioon
3. Mis on ennustamine
4. Klassifikatsiooni ja ennustamise sarnasused
5. Kõrvuti võrdlus - klassifitseerimine vs ennustamine tabelina
6. Kokkuvõte
Klassifikatsioon on uue vaatluse kategooria või klassimärgise tuvastamine. Esiteks kasutatakse treeningandmetena andmekogumit. Sisendandmete komplekt ja vastavad väljundid antakse algoritmile. Seega sisaldab treeningute andmekogum sisendandmeid ja nendega seotud klassimärgiseid. Treeningu andmestikku kasutades saab algoritm mudeli või klassifikaatori. Tuletatud mudel võib olla otsustuspuu, matemaatiline valem või närvivõrk. Klassifitseerimisel tuleks mudelile märgistamata andmete korral leida see klass, millesse ta kuulub. Mudelile edastatud uued andmed on katseandmete komplekt.
Klassifikatsioon on dokumendi klassifitseerimise protsess. Üks lihtne klassifitseerimise näide on kontrollida, kas sajab vihma või mitte. Vastus võib olla kas jah või ei. Niisiis, valikuid on eriti palju. Mõnikord võib klassifitseerida rohkem kui kaks klassi. Seda nimetatakse mitmeklassiline klassifikatsioon. Reaalses elus peab pank analüüsima, kas konkreetsele kliendile laenu anda on riskantne või mitte. Selles näites on kategoorilise sildi leidmiseks konstrueeritud mudel. Sildid on riskantsed või ohutud.
Teine andmete analüüsimise protsess on ennustamine. Seda kasutatakse arvväljundi leidmiseks. Nagu klassifikatsioonis, sisaldab treeningu andmestik sisendeid ja vastavaid arvulisi väljundväärtusi. Treeningu andmestiku järgi tuletab algoritm mudeli või ennustaja. Uute andmete esitamisel peaks mudel leidma arvulise väljundi. Erinevalt klassifitseerimisest puudub sellel meetodil klassimärk. Mudel ennustab pideva väärtusega funktsiooni või tellitud väärtust.
Ennustamiseks kasutatakse tavaliselt regressiooni. Prognoosimise näide on maja väärtuse ennustamine sõltuvalt faktidest nagu tubade arv, üldpind jne. Ettevõte võib leida kliendi poolt müügi ajal kulutatud rahasumma. See on ka näide ennustamiseks.
Klassifikatsioon vs eeldamine | |
Klassifikatsioon on protsess, mille abil tuvastatakse, millisesse kategooriasse uus vaatlus kuulub, tuginedes treeningu andmestikule, mis sisaldab vaatlusi, mille kategooriasse kuulumine on teada. | Ennustamine on puuduvate või kättesaamatute arvandmete tuvastamine uue vaatluse jaoks. |
Täpsus | |
Klassifitseerimisel sõltub täpsus klassimärgi korrektsest leidmisest. | Ennustamisel sõltub täpsus sellest, kui hästi suudab antud ennustaja uute andmete eeldatava atribuudi väärtuse ära arvata. |
Mudel | |
Kategooriliste siltide leidmiseks konstrueeritakse mudel või klassifikaator. | Konstrueeritakse mudel või ennustaja, mis ennustab pideva väärtusega funktsiooni või tellitud väärtust. |
Mudeli sünonüümid | |
Klassifitseerimisel võib mudelit nimetada klassifikaatoriks. | Ennustamisel võib mudelit nimetada ennustajaks. |
Tähtsa teabe hankimine tohutust andmekogumist on andmekaevandamine. Selles artiklis käsitletakse kahte andmete analüüsimise meetodit andmekaevandamisel, näiteks klassifitseerimist ja ennustamist. Kiirus, mastaapsus ja vastupidavus on arvestatavad tegurid klassifitseerimise ja prognoosimise meetodites. Klassifikatsioon on uue vaatluse kategooria või klassimärgise tuvastamise protsess, millesse see kuulub. Ennustamine on puuduvate või kättesaamatute arvandmete tuvastamine uue vaatluse jaoks. See on erinevus klassifitseerimise ja ennustamise vahel.
1.Punkt, juhendid. „Andmekaevandamise klassifikatsioon ja ennustamine.”, Juhendid, 8. jaanuar 2018. Saadaval siin
2. Statistiline klassifikaator. Vikipeedia, Wikimedia Foundation, 6. märts 2018. Saadaval siin
1. 2727773, autor GDJ (avalik domeen) pixabay kaudu