Juhendatud õpe ja juhendamata õpe on masinõppe kaks peamist mõistet. Juhendatud õpe on masinõppe ülesanne funktsiooni õppimiseks, mis kaardistab sisendi väljundisse, kasutades sisend-väljundnäidipaari. Juhendamata õpe on masinõppe ülesanne, mille abil saab järeldada funktsiooni kirjeldamata andmete peidetud struktuuri kirjeldamiseks. võtme erinevus juhendatud ja juhendamata masinõppe vahel on just see juhendatud õpe kasutab märgistatud andmeid, samal ajal kui juhendamata õpe kasutab märgistamata andmeid.
Masinõpe on arvutiteaduse valdkond, mis annab arvutisüsteemile võimaluse õppida andmetest ilma seda selgesõnaliselt programmeerimata. See võimaldab andmeid analüüsida ja prognoosida nende mustreid. Masinõppe rakendusi on palju. Mõned neist on näotuvastus, žeste äratundmine ja kõnetuvastus. Masinõppega on seotud erinevad algoritmid. Mõned neist on regressioon, klassifitseerimine ja rühmitamine. Kõige tavalisemad programmeerimiskeeled masinõppel põhinevate rakenduste väljatöötamiseks on R ja Python. Kasutada võib ka teisi keeli, nagu Java, C ++ ja Matlab.
1. Ülevaade ja peamised erinevused
2. Mis on juhendatud õpe
3. Mis on juhendamata õpe
4. Sarnasused juhendatud ja juhendamata masinõppe vahel
5. Kõrvuti võrdlus - juhendatud vs juhendamata masinõpe tabelina
6. Kokkuvõte
Masinõppel põhinevates süsteemides töötab mudel algoritmi järgi. Juhendatud õppes juhendatakse mudelit. Esiteks on vajalik mudeli koolitamine. Saadud teadmiste abil suudab ta ennustada vastuseid tulevastele juhtumitele. Mudeli treenimiseks kasutatakse märgistatud andmestikku. Kui süsteemile antakse proovivälised andmed, saab see tulemust ennustada. Järgnev on väike väljavõte populaarsest IRIS-i andmekogumist.
Ülaltoodud tabeli kohaselt nimetatakse atribuutideks Sepaali pikkust, Sepaali laiust, Pateli pikkust, Pateli laiust ja Liiki. Veerge nimetatakse omadusteks. Ühel real on andmed kõigi atribuutide kohta. Seetõttu nimetatakse ühte rida vaatluseks. Andmed võivad olla numbrilised või kategoorilised. Mudelile on antud vaatlused, mille sisendiks on vastav liigi nimi. Uue vaatluse korral peaks mudel ennustama, millist tüüpi liike ta kuulub.
Juhendatud õppes on olemas klassifitseerimise ja regressiooni algoritmid. Klassifikatsioon on märgistatud andmete klassifitseerimise protsess. Mudel lõi piirid, mis eraldasid andmekategooriad. Kui mudelile antakse uusi andmeid, saab seda kategoriseerida punkti olemasolu järgi. K-Lähimad naabrid (KNN) on klassifikatsioonimudel. Sõltuvalt k väärtusest otsustatakse kategooria. Näiteks kui k on 5, kui konkreetne andmepunkt asub kaheksa A-kategooria andmepunkti ja B-kategooria kuue andmepunkti lähedal, siis klassifitseeritakse andmepunkt A-ks.
Regressioon on varasemate andmete suundumuse prognoosimise protsess, et ennustada uute andmete tulemusi. Regressioonina võib väljund koosneda ühest või mitmest pidevast muutujast. Ennustamisel kasutatakse rida, mis katab enamiku andmepunkte. Lihtsaim regressioonimudel on lineaarne regressioon. See on kiire ja ei vaja selliste parameetrite häälestamist nagu KNN-is. Kui andmed näitavad paraboolset suundumust, siis lineaarse regressiooni mudel ei sobi.
Need on mõned näited juhendatud õppealgoritmidest. Üldiselt on juhendatud õppemeetoditest saadud tulemused täpsemad ja usaldusväärsemad, kuna sisendandmed on hästi teada ja märgistatud. Seetõttu peab masin analüüsima ainult varjatud mustreid.
Juhendamata õppe korral mudelit ei juhendata. Mudel töötab tulemuste ennustamiseks iseseisvalt. Sildistamata andmete kohta järelduste tegemiseks kasutab see masinõppe algoritme. Üldiselt on juhendamata õppe algoritmid raskemad kui juhendatud õppe algoritmid, kuna teavet on vähe. Klasterdamine on teatud tüüpi juhendamata õpe. Seda saab kasutada tundmatute andmete rühmitamiseks algoritmide abil. K-keskmine ja tiheduspõhine klasterdamine on kaks klastrialgoritmi.
k-keskmine algoritm, paigutab k keskpunkti juhuslikult iga klastri jaoks. Seejärel määratakse iga andmepunkt lähimale keskpunktile. Eukleidilist kaugust kasutatakse andmepunkti ja tsentridi vahekauguse arvutamiseks. Andmepunktid liigitatakse rühmadesse. K-keskpunktide positsioonid arvutatakse uuesti. Uue tsentroidiasendi määrab rühma kõigi punktide keskmine. Jällegi omistatakse iga andmepunkt lähimale keskpunktile. See protsess kordub seni, kuni tsentroidid enam ei muutu. k-mean on kiire rühmituse algoritm, kuid klastripunktide täpsustatud lähtestamine puudub. Samuti on klastrimudelite varieerumine klastripunktide initsialiseerimisel väga erinev.
Teine klastrialgoritm on Tihedusel põhinev klasterdamine. Seda tuntakse ka müraga tiheduspõhiste ruumiliste klastrite rakendustena. See toimib, määratledes klastri maksimaalse tihedusega ühendatud punktide kogumina. Need on kaks parameetrit, mida kasutatakse tiheduspõhisel klastrimisel. Need on Ɛ (epsilon) ja minimaalsed punktid. Ɛ on naabruskonna maksimaalne raadius. Miinimumpunktid on minimaalne punktide arv naabruses Ɛ klastri määratlemiseks. Need on mõned näited rühmitamisest, mis langeb juhendamata õppimisse.
Üldiselt pole järelevalveta õppealgoritmidest saadud tulemused kuigi täpsed ja usaldusväärsed, kuna masin peab enne peidetud mustrite ja funktsioonide määratlemist sisestusandmed määratlema ja sildistama..
Juhendatud vs juhendamata masinõpe | |
Juhendatud õpe on masinõppe ülesanne funktsiooni õppimiseks, mis kaardistab sisendi väljundisse sisend-väljundnäidete paaride alusel. | Juhendamata õppimine on masinõppe ülesanne, mille abil saab järeldada funktsiooni kirjeldamata andmete peidetud struktuuri kirjeldamiseks. |
Peamine funktsionaalsus | |
Juhendatud õppe korral ennustab mudel tulemust märgistatud sisendandmete põhjal. | Juhendamata õppe korral ennustab mudel tulemust ilma märgistatud andmeteta, tuvastades mustrid iseseisvalt. |
Tulemuste täpsus | |
Juhendatud õppemeetoditest saadud tulemused on täpsemad ja usaldusväärsemad. | Juhendamata õppemeetodite abil saadud tulemused pole kuigi täpsed ja usaldusväärsed. |
Peamised algoritmid | |
Juhendatud õppes on olemas regressiooni ja klassifitseerimise algoritmid. | Juhendamata õppe rühmitamiseks on olemas algoritmid. |
Juhendatud õpe ja juhendamata õpe on kahte tüüpi masinõpe. Juhendatud õpe on masinõppe ülesanne funktsiooni õppimiseks, mis kaardistab sisendi väljundisse sisend-väljundnäidete paaride alusel. Juhendamata õppimine on masinõppe ülesanne, mille abil saab järeldada funktsiooni kirjeldamata andmete peidetud struktuuri kirjeldamiseks. Erinevus juhendatud ja juhendamata masinõppe vahel on see, et juhendatud õppimisel kasutatakse märgistatud andmeid, samal ajal kui juhendamata koolituse korral kasutatakse märgistamata andmeid.
1.TheBigDataUniversity. Masinõpe - juhendatud VS juhendamata õppimine, kognitiivne klass, 13. märts 2017. Saadaval siin
2. “Juhendamata õpe”. Wikipedia, Wikimedia Foundation, 20. märts 2018. Saadaval siin
3. „Juhendatud õpe”. Vikipeedia, Wikimedia Foundation, 15. märts 2018. Saadaval siin
1. 2727781, autor GDJ (avalik domeen) pixabay kaudu