Data Vault Generation
Wij hanteren het label Open Access voor onderzoek met een Creative Commons licentie. Door een CC-licentie toe te kennen, geeft de auteur toestemming aan anderen om zijn of haar werk te verspreiden, te delen of te bewerken. Voor meer informatie over wat de verschillende CC-licenties inhouden, klik op het CC-icoon. Alle rechten voorbehouden wordt gebruikt voor publicaties waar enkel de auteurswet op van toepassing is.
Data Vault Generation
Wij hanteren het label Open Access voor onderzoek met een Creative Commons licentie. Door een CC-licentie toe te kennen, geeft de auteur toestemming aan anderen om zijn of haar werk te verspreiden, te delen of te bewerken. Voor meer informatie over wat de verschillende CC-licenties inhouden, klik op het CC-icoon. Alle rechten voorbehouden wordt gebruikt voor publicaties waar enkel de auteurswet op van toepassing is.
Samenvatting
Dit onderzoek richt zich op het onderzoeken van de datavault. Hierbij ligt de nadruk op het automatisch genereren van een datavault. Brengt dit nou hoofdzakelijk voordelen met zich mee of kleven er juist veel nadelen aan. Data Vault is een relatief nieuwe methodologie om een datawarehouse op te zetten. De bedenker hiervan is Dan Linstedt.
Als eerst is er gekeken wat de taak is van een datawarehouse in een bedrijf. Een datawarehouse is een manier om data op te slaan zodat er rapporten van de data gemaakt worden. Deze rapporten worden gebruikt als ondersteuning voor beslissingsmomenten. De term "datawarehouse" beslaat meer dan alleen een database. Het bevat een datasource, deze levert de informatie. Dan wordt de data schoongemaakt alvorens het in de datastorage beland. De datastorage is de opslagplaats, deze is vaak aangeduid als datawarehouse. Daarna komen er verschillende technieken om analyses op de data uit te voeren. Als laatste wordt de data, inzichtelijk, aan de eindgebruiker gepresenteerd. Het is dus het gehele proces van bronsysteem naar rapport.
Dan Linstedt heeft de Data Vault bedacht. Er waren er achter al twee die hem voorgingen. Zo was er Bill Inmon. Deze had als eerste een theorie over datawarehousing. De zogenaamde top down approach. De centrale datawarehouse is een belangrijk aspect van deze theorie. Daarna kwam Ralph Kimball met de bottom up approach. Een manier om vanuit datamarts, dat zijn kleine datawarehouses, toch een groot datawarehouse te realiseren. Dan Linstedt vond het nodig om zijn theorie te ontwikkelen aangezien er ruimte was voor verbetering. Zo biedt de Data Vault een uitstekende auditability. Dat houdt in dat de historie van gegevens eenvoudig bekeken kan worden. Verder is de Data Vault goed schaalbaar. Het nadeel is het aanleren van een nieuwe modeleringstechniek.
De Data Vault bestaat uit drie basisonderdelen. De Hub, Link en Satellite. Een Hub representeert een entiteit. Een Link is het equivalent van een relatie in een normale database. Tot slot is er de Satellite. Deze geeft context aan een Hub of Link. Zo is er aan een Hub een of meerdere Satellites gekoppeld. Een Link mag maximaal een Satellite hebben. Het opbouwen van een datavault gebeurt door te beginnen met het maken van de Hubs. Dan de Links en als laatste de Satellites.
Bij automatische generatie van de datavault is het eenvoudiger om deze volgorde aan te passen. Dan wordt er begonnen met het maken van de Hubs. Dan volgen de Satellites en daarna komen de Links. Elke tabel wordt een Hub en een Satellite. Elke relatie wordt omgezet naar een Link. De voordelen van het automatisch genereren zijn tijdswinst, genormaliseerde naamgeving en de consistente basis van waaruit verder gewerkt kan worden. Een nadeel is dat het foutgevoelig is. Een bug in het systeem moet snel ontdekt worden, anders kan het escaleren. Een ander nadeel is de verminderde flexibiliteit.

Organisatie | HZ University of Applied Sciences |
Opleiding | Informatica |
Instituut | Academie voor Technologie & Innovatie |
Partners | Avanade Netherlands BV, Almere |
Datum | 2012-07-04 |
Type | Bachelorscriptie |
Taal | Nederlands |