Andmete kaevandamine vs andmete ladustamine
Andmete kaevandamise protsess viitab arvutiteaduse harule, mis tegeleb mustrite eraldamisega suurtest andmekogumitest. Seejärel ühendatakse need komplektid statistilisi meetodeid kasutades ja tehisintellekti abil. Andmete kaevandamine tänapäevases ettevõttes vastutab töötlemata andmete muundamise eest tehisintellekti allikateks. Andmetega manipuleeritakse ja seega on nad võimelised andma usaldusväärseid otsuseid, mida saab kasutada otsuste tegemisel. See annab ettevõtetele konkurentsi ees eelise, kuna neil on andmekogumid, millele saab luureandmetes tugineda. Organisatsioonid kasutavad andmete kaevandamist ka profiilide koostamise tavades, sealhulgas turunduse, teaduse avastamise ja pettuste avastamise jälgimisel.
Andmete kaevandamisega võib olla seotud ka muid levinud termineid, näiteks andmepüük, andmete süvendamine või isegi andmete nuhkimine. Kõik need viitavad andmete kaevandamise erinevatele variatsioonidele, mida kasutatakse väikeste andmekogumite valimisel, mis võivad olla statistiliste järelduste tegemiseks liiga väikesed. Need on aga kasutatavate andmete paikapidavuse määratlemisel üliolulised ja neid saab kasutada hüpoteesi loomisel, kui loota antud andmepopulatsiooni jõudmist.
Andmeladu seevastu on termin, mis kirjeldab organisatsiooni süsteemi, mida kasutatakse andmete kogumisel. Andmelao kogutud andmeid pakuvad sellised tehingusüsteemid nagu arve-, ostu- või isegi laenukirjed. Andmekirjed võetakse üksikutest loomise punktidest ja koondatakse ühe katuse alla, milleks on andmeladu. Seejärel edastatakse need andmed ja aruandlus toimub koondatud viisil, et abistada äriteabe kasutajaid kehtivate otsuste tegemisel. Andmeladu efektiivseks tööks eeldab andmeallikat, andmebaasi ja aruandlustööriista.
Seetõttu võib öelda, et andmeladu on andmebaas, mida kasutatakse analüüsitud andmete aruandluse eesmärkidel. Need andmed pärinevad erinevatest süsteemidest, mis on aruandluse jaoks üles seatud.
Oma funktsiooni täitmiseks hoiab andmeladu funktsioone kolmes erinevas kihis. Nende hulka kuulub lavastus, integreerimine ja juurdepääs. Üleminekuprotsessis säilitavad arendajad töötlemata andmeid ainult analüüsi ja toe jaoks. Integratsioonikihti kasutatakse andmete integreerimisel ja andmete kasutajate abstraktsiooni taseme saavutamiseks. Viimaseks on juurdepääsu kiht oluline andmete erinevatest kasutajatest eemaldumiseks.
Nii andmete kaevandamist kui ka andmete ladustamist võib nimetada vahenditeks, mida kasutatakse äriteabe kogumiseks. Nende kahe peamine erinevus on see, kuidas äriteavet kogutakse. Seetõttu võib öelda, et hästi ladustatud andmeid on üsna lihtne kaevandada ja seega ära kasutada. Seega vastutab andmeladu andmete kaevandamise töö hõlbustamise eest kõigi asjakohaste andmete, mis tuleb kaevandada keskses asukohas, paigutamise asemel, selle asemel, et andmete kaevandamine peaks pidevalt otsima andmeid eri kohtadest. See aitab kokku hoida andmete kaevandamiseks kuluvat aega ja kaevandamisel kasutatud ressursse.
Kokkuvõte
Andmete kaevandamine on andmete ekstraheerimise protsess suurtest andmekogumitest.
Andmete ladustamine on kõigi asjakohaste andmete koondamine.
Nii andmete kaevandamine kui ka andmete ladustamine on äriteabe kogumise tööriistad.
Andmete kaevandamine on andmete kogumisel konkreetne.
Andmehoidlad on aja kokkuhoiu ja efektiivsuse suurendamise tööriist, koondades organisatsiooni erinevatest piirkondadest pärit asukoha andmed.
Andmelaos on kolm kihti, nimelt lavastus, integreerimine ja juurdepääs.