Masinõpe on meetodikomplekt, mida kasutatakse arvutiprogrammide loomiseks, mis võimaldavad vaatlustest õppida ja ennustusi teha. Masinõpe kasutab andmete mõistmiseks algoritme, regressioone ja seotud teadusi. Neid algoritme võib üldiselt pidada statistilisteks mudeliteks ja võrkudeks.
Süvaõpe on masinõppe meetodite alamhulk. Andmeid sõelutakse sügavõppimisvõrgu mitme kihi kaudu, et võrk saaks andmete põhjal järeldusi teha ja otsuseid langetada. Süvaõppe meetodid võimaldavad suurtes andmekogumites suurt täpsust, kuid need funktsioonid muudavad sügava õppimise palju ressursimahukamaks kui klassikaline masinõpe.
Juba mitu aastakümmet on masinõpet kasutatud masinate tehisintellekti saavutamise meetodina. Selle keskmes on masinõppe valdkond õppimiseks ja otsuste vastuvõtmiseks võimeliste arvutite loomiseks, mis muudab masinõppe tehisintellekti uuringuteks hästi sobivaks. Kuid mitte kõik masinõppe mudelid ei ole mõeldud “tõelise” tehisintellekti arendamiseks, mis täiuslikult vastab või ületab inimese intelligentsust. Selle asemel on mudelid mõeldud sageli konkreetsete, piiratud probleemide uurimiseks.
Masinõppega seotud arutelude varajases etapis pakuti välja sügav õppimine, kuid vähesed teadlased kasutasid sügava õppe meetodeid, kuna sügava õppimise arvutuslikud nõuded on palju suuremad kui klassikalise masinõppe korral. Kuid arvutite arvutusvõimsus on alates 2000. aastast hüppeliselt kasvanud, võimaldades teadlastel masinaõppe ja tehisintellekti ehitamisel tohutult paraneda. Kuna sügava õppimise mudelid sobivad suurenenud andmete abil hästi, on sügaval õppimisel võimalik ületada olulised takistused tõelise tehisintellekti loomisel.
Masinõpe ja sügav õppimine on mõlemad algoritmid. Klassikalises masinõppes kasutavad teadlased suhteliselt vähe andmeid ja otsustavad, millised on kõige olulisemad omadused andmetes, mida algoritm prognooside tegemiseks vajab. Seda meetodit nimetatakse funktsioonide väljatöötamiseks. Näiteks kui masinõppeprogrammi õpetataks lennuki pilti ära tundma, koostaksid selle programmeerijad algoritmid, mis võimaldavad programmis ära tunda kommertslennukite tüüpilised kujud, värvid ja suurused. Selle teabe abil annaks masinõppeprogramm ennustusi selle kohta, kas pilte näidatakse kaasasolevate lennukitega.
Süvaõpe eristub klassikalisest masinõppest selle otsustusprotsessi paljude kihtide poolest. Süvaõppevõrgustikke peetakse sageli „mustadeks kastideks”, kuna andmeid parsitakse mitme võrgukihi kaudu, millest igaüks teeb tähelepanekuid. See võib muuta tulemused raskemini mõistetavaks kui klassikalise masinõppe tulemused. Kihtide või etappide täpne arv otsuste tegemisel sõltub valitud mudeli tüübist ja keerukusest.
Masinõppes kasutatakse õppimiseks ja ennustuste tegemiseks tavaliselt väikeseid andmekogumeid. Väikeste andmemahtude abil saavad teadlased kindlaks teha täpsed omadused, mis aitavad masinõppeprogrammil andmetest aru saada ja neist õppida. Kui aga programmis on teavet, mida ta ei saa olemasolevate algoritmide põhjal klassifitseerida, peavad teadlased problemaatilisi andmeid käsitsi analüüsima ja looma uue funktsiooni. Seetõttu ei kattu klassikaline masinõpe tavaliselt suurte andmemahtudega, kuid see võib väiksemate andmekogude vigu minimeerida.
Sügav õppimine sobib eriti suurte andmekogude jaoks ja sageli vajavad mudelid suurtest andmekogumitest kasu. Süvaõppevõrgu keerukuse tõttu vajab võrk pärast koolitust võrgu testimiseks märkimisväärsel hulgal koolitusandmeid ja lisaandmeid. Praegu viimistlevad teadlased sügava õppe võrgustikke, mis võivad olla tõhusamad ja kasutada väiksemaid andmekogumeid.
Masinõppel on erinevad arvuti jõudluse nõuded. Seal on palju mudeleid, mida saab kasutada keskmise personaalarvutiga. Mida arenenumad statistilised ja matemaatilised meetodid saavad, seda raskem on arvutil andmeid kiiresti töödelda.
Sügav õppimine kipub olema väga ressursimahukas. Suure hulga teabe sõelumine otsustusprotsessi mitme kihi kaudu nõuab palju arvutusvõimet. Arvutite kiirenedes on sügavamale õppimine üha kättesaadavam.
Traditsiooniliselt on masinõppel mõned ühised ja olulised piirangud. Ülemüürimine on statistiline probleem, mis võib mõjutada masinõppe algoritmi. Masinõppe algoritm sisaldab andmete analüüsimisel ja ennustamisel teatud hulgal „viga”. Algoritm peaks väidetavalt näitama seost asjakohaste muutujate vahel, kuid ületalitluse korral hakkab see ka viga jäädvustama, mis toob kaasa “mürarikkama” või ebatäpse mudeli. Masinõppe mudelid võivad muutuda ka kallutatuks nende andmete idiosünkraažide suhtes, millega neid koolitati - probleem on eriti ilmne siis, kui teadlased koolitavad algoritme kogu saadaolevas andmekogumis, selle asemel et osa andmeid salvestada, et testida algoritmi.
Sügaval õppimisel on samad statistilised lõksud kui klassikalisel masinõppel, aga ka paaril ainulaadsel teemal. Paljude probleemide jaoks pole piisavalt täpset sügava õppimise võrgu koolitamiseks piisavalt andmeid. Sageli on kulupõhine või võimatu koguda rohkem andmeid reaalmaailma probleemi kohta või seda simuleerida, mis piirab praegust teemade ringi, mille jaoks süvaõpet saab kasutada.
Masinõpe ja sügav õppimine kirjeldavad nii arvutite õppimise kui ka otsuste vastuvõtmise meetodeid. Süvaõpe on klassikalise masinõppe alamhulk ja mõned olulised erinevused muudavad sügava õppe ja masinõppe igaks otstarbeks erinevateks rakendusteks.