Tähtede ja lumehelveste skeemi erinevus

Andmeladu on süsteem, mis on loodud andmete hoidmiseks ja korraldamiseks keskandmehoidlates, sealhulgas muudest allikatest pärit andmed. See on relatsiooniliste andmebaasimudelite äriteabe põhikontseptsioon, mis kasutab analüütilisi tehnikaid, et integreerida äriandmed keskandmebaasi.

Andmete ladustamisel kasutatakse kahte levinumat arhitektuurimudelit:

  • Täheskeem
  • Lumehelveste skeem

Mõlemad on tavalised mitmemõõtmelised andmebaasimudelid, mida kasutatakse suurte andmebaaside vajaduste rahuldamiseks analüütilistel eesmärkidel tegelikes andmeladudes.

Esitame kahe erapooletu võrdluse, et paremini mõista, kumb on parem kui teine.

Mis on täheskeem?

See on kõige levinum ja laialt aktsepteeritud arhitektuurimudel, mida kasutatakse andmeladude ja andmekaartide väljatöötamiseks, kus andmed on jaotatud faktideks ja mõõtmeteks. See on lihtsaim arhitektuurimudel, milles ühte faktabelit kasutatakse mitmemõõtmeliste tabelite viitamiseks, jäljendades tähekujulist mustrit.

Nagu nimigi ütleb, sarnaneb diagramm tähega, mille keskel on faktabel ja sellest kiirgavad mitmemõõtmelised tabelid, luues tähekujulise mustri.

Seda tuntakse ka tärniga liitumise skeemina ja see salvestab kõik dimensiooni atribuudid ühte denormaliseeritud faktabelisse, et kiiresti liikuda suurtes mitmemõõtmelistes andmekogumites, mis kajastavad kiireid päringutele reageerimise aegu.

Mis on lumehelveste skeem?

See on täheskeemi laiendus, millele on lisatud funktsioone. Erinevalt täheskeemist normaliseeritakse lumehelveskeemi mõõtmete tabelid mitmeks omavahel seotud tabeliks.

Arhitektuurimudel kujutab tabelite loogilist paigutust paljudevaheliste suhete hierarhias, kus mitmemõõtmelised tabelid normaliseeritakse alamõõtmelisteks tabeliteks, meenutades lumehelbekujulist mustrit, sellest ka nimi.

See on täheskeemi keerukam versioon, milles on rohkem liitumisi dimensioonitabelite vahel, mis kajastab andmete hankimiseks aeglast töötlemisaega, mis tähendab aeglast päringu reageerimise aega. See minimeerib andmete liiasuse, mis omakorda parandab päringu jõudlust.

Tähtede ja lumehelveste skeemi erinevus

Tähe- ja lumehelveste skeemi arhitektuur

Relatsioonandmebaasides on täheskeem lihtsaim arhitektuurimudel, mida kasutatakse andmeladude ja mitmemõõtmeliste andmekaartide väljatöötamiseks. Nagu nimigi ütleb, sarnaneb mudel tähega, mille punktid kiirgavad keskelt, st faktitabel on kese ja punktid on mõõtmete tabelid. Nagu teisedki mõõtmete mudelid, koosneb see andmetest faktide ja mõõtmete kujul. Lumehelveskeem on seevastu keerukam arhitektuurimudel, mis viitab mitmemõõtmelisele andmebaasile lumehelbe kujul olevate tabelite loogilise paigutusega.

Mõõtude tabel

Lumehelveskeem on üsna sarnane täheskeemiga, välja arvatud see, et sellel võib olla mitu dimensioonitabelit, mida normaliseeritakse mitmeks omavahel seotud tabeliks, mida nimetatakse alamõõtmetabeliteks. See esindab suhteid mitmel tasandil, mis hargnevad lumehelbe mustriks. Kuid täheskeem salvestab kõik dimensiooni seotud atribuudid ühte denormaliseeritud dimensioonitabelisse, mis teeb lihtsamate päringute mõistmise ja käsitlemise lihtsaks.

Tähe- ja lumehelveste skeemi ärimudel

Mõõtmetetabel ei tohi sisaldada relatiivsete andmebaasimudelite dubleerivaid ridasid lihtsa tõsiasja tõttu, et see võib tekitada ebaselgust. Igas tabelis peaks olema veerg või veergude kombinatsioon, mida nimetatakse primaarvõtmeks ja mis identifitseerib unikaalselt kõik tabeli kirjed. Võõras võti on veerg või veerugrupp, mis loob lingi kahe tabeli vahel. Täheskeemis on igal dimensioonitabelil primaarvõti, mis on seotud faktabeli võõra võtmega. Lumehelveskeemi ärihierarhiat esindab primaarvõtme / võõra võtme suhe dimensioonitabelite vahel.

Andmete terviklikkus tähe- ja lumehelveste skeemis

Kahe relatsioonilise andmebaasi mudeli peamine erinevus on normaliseerimine. Täheskeemi mõõtmetabelid ei ole normaliseeritud, st ärimudel kasutab mõõtmetetabelite talletamiseks suhteliselt rohkem ruumi ja rohkem ruumi tähendab üleliigseid kirjeid, mis lõppkokkuvõttes põhjustaks vastuolu. Lumehelveste skeem seevastu minimeerib andmete liiasust, kuna normaliseeritakse mõõtmetabelid, mis moodustavad palju vähem koondatud kirjeid. Ettevõtte hierarhiat ja selle mõõtmeid säilitatakse viite terviklikkuse kaudu, st suhteid saab andmeladudes iseseisvalt värskendada.

Päringu jõudlus

Tärniskeemil on dimensioonitabeli ja faktabeli vahel vähem liitumisi kui lumehelbe skeemil, millel on mitu liitmist, mis moodustab väiksema päringu keerukuse. Kuna täheskeemi mõõtmed on ühendatud keskse faktabeli kaudu, on sellel selged liitumisteed, mis tähendavad kiiret päringu reageerimise aega ja kiire reageerimise aeg paremat toimimist. Lumehelbe skeemil on suurem liitumiste arv, seega on pikemad päringule reageerimise ajad, mille tulemuseks on keerukamad päringud, mis lõppkokkuvõttes kahjustavad jõudlust.

Täheskeem vs lumehelveste skeem: võrdlusdiagramm


Tähesalmide kokkuvõte Lumehelveste skeem

Mõlemad on kõige levinumad ja laialdasemalt kasutusele võetud arhitektuurimudelid, mida kasutatakse andmebaasiladude ja andmekaartide väljatöötamiseks. Igal ärimudelil on siiski õiglane osa plusse ja miinuseid. Kui täheskeem on lihtsaim mitmemõõtmeline mudel, mida kasutatakse andmete jaotamiseks faktideks ja mõõtmeteks, sobib see ideaalselt vähem keerukate suhetega andmekaartide väljatöötamiseks. Lumehelveste skeem on mitmemõõtmelises andmebaasis olevate tabelite loogiline esitus, milles mõõtmed salvestatakse alamõõtmetabelites. Peamine erinevus nende kahe vahel on normaliseerimine. Lumehelveskeemi mõõtmetabelid normaliseeritakse täielikult mitmeks otsingutabeliks, samas kui täheskeemis on dimensioonitabelid normaliseeritud üheks keskseks faktabeliks.