De grootste kennisbank van het HBO

Inspiratie op jouw vakgebied

Vrij toegankelijk

Terug naar zoekresultatenDeel deze publicatie

Data Vault Generation

Rechten: Alle rechten voorbehouden

Data Vault Generation

Rechten: Alle rechten voorbehouden

Samenvatting

Dit onderzoek richt zich op het onderzoeken van de datavault. Hierbij ligt de nadruk op het automatisch genereren van een datavault. Brengt dit nou hoofdzakelijk voordelen met zich mee of kleven er juist veel nadelen aan. Data Vault is een relatief nieuwe methodologie om een datawarehouse op te zetten. De bedenker hiervan is Dan Linstedt.

Als eerst is er gekeken wat de taak is van een datawarehouse in een bedrijf. Een datawarehouse is een manier om data op te slaan zodat er rapporten van de data gemaakt worden. Deze rapporten worden gebruikt als ondersteuning voor beslissingsmomenten. De term "datawarehouse" beslaat meer dan alleen een database. Het bevat een datasource, deze levert de informatie. Dan wordt de data schoongemaakt alvorens het in de datastorage beland. De datastorage is de opslagplaats, deze is vaak aangeduid als datawarehouse. Daarna komen er verschillende technieken om analyses op de data uit te voeren. Als laatste wordt de data, inzichtelijk, aan de eindgebruiker gepresenteerd. Het is dus het gehele proces van bronsysteem naar rapport.

Dan Linstedt heeft de Data Vault bedacht. Er waren er achter al twee die hem voorgingen. Zo was er Bill Inmon. Deze had als eerste een theorie over datawarehousing. De zogenaamde top down approach. De centrale datawarehouse is een belangrijk aspect van deze theorie. Daarna kwam Ralph Kimball met de bottom up approach. Een manier om vanuit datamarts, dat zijn kleine datawarehouses, toch een groot datawarehouse te realiseren. Dan Linstedt vond het nodig om zijn theorie te ontwikkelen aangezien er ruimte was voor verbetering. Zo biedt de Data Vault een uitstekende auditability. Dat houdt in dat de historie van gegevens eenvoudig bekeken kan worden. Verder is de Data Vault goed schaalbaar. Het nadeel is het aanleren van een nieuwe modeleringstechniek.

De Data Vault bestaat uit drie basisonderdelen. De Hub, Link en Satellite. Een Hub representeert een entiteit. Een Link is het equivalent van een relatie in een normale database. Tot slot is er de Satellite. Deze geeft context aan een Hub of Link. Zo is er aan een Hub een of meerdere Satellites gekoppeld. Een Link mag maximaal een Satellite hebben. Het opbouwen van een datavault gebeurt door te beginnen met het maken van de Hubs. Dan de Links en als laatste de Satellites.

Bij automatische generatie van de datavault is het eenvoudiger om deze volgorde aan te passen. Dan wordt er begonnen met het maken van de Hubs. Dan volgen de Satellites en daarna komen de Links. Elke tabel wordt een Hub en een Satellite. Elke relatie wordt omgezet naar een Link. De voordelen van het automatisch genereren zijn tijdswinst, genormaliseerde naamgeving en de consistente basis van waaruit verder gewerkt kan worden. Een nadeel is dat het foutgevoelig is. Een bug in het systeem moet snel ontdekt worden, anders kan het escaleren. Een ander nadeel is de verminderde flexibiliteit.

Toon meer
OrganisatieHZ University of Applied Sciences
OpleidingInformatica
InstituutAcademie voor Technologie & Innovatie
PartnersAvanade Netherlands BV, Almere
Gepubliceerd in
Datum2012-07-04
TypeBachelorscriptie
TaalNederlands

Op de HBO Kennisbank vind je publicaties van 25 hogescholen

De grootste kennisbank van het HBO

Inspiratie op jouw vakgebied

Vrij toegankelijk