De grootste kennisbank van het HBO

Inspiratie op jouw vakgebied

Vrij toegankelijk

Terug naar zoekresultatenDeel deze publicatie

Data Integration Framework

Rechten: Alle rechten voorbehouden

Data Integration Framework

Rechten: Alle rechten voorbehouden

Samenvatting

Het lectoraat DIO/EMM doet een onderzoek naar de mogelijkheden om een semantisch web toe te passen als hulpmiddel bij kennisuitwisseling. Voor dit doel zijn er diverse databronnen beschikbaar gemaakt, zoals sensoren, databases en web-services. Het probleem ligt in de diverse natuur van deze databronnen en in het continu genereren van nieuwe data(soorten) door de onderliggende systemen. Daarom is er een behoefte ontstaan aan een data integration framework, waarmee niet-semantische data zonder vaste structuur zodanig getransformeerd worden, dat deze in een semantische database (triplestore) opgenomen en geanalyseerd kunnen worden.
Om dit doel te realiseren is er een onderzoek gedaan naar de achterliggende theorie. Daarin is onderzocht hoe het semantische web werkt, en wat er al bekend is op het gebied van data integration binnen het semantische web. Vervolgens is er met de stakeholders besproken wat er van een data integration framework verwacht wordt. Op basis van deze gesprekken zijn er een aantal potentiële problemen in kaart gebracht, en er is een lijst van requirements opgesteld. Op basis van de theorie en de eerder opgestelde lijst van requirements is er een ontwerp opgesteld. Dit ontwerp is vervolgens omgezet naar een prototype. Dit prototype was opgebouwd op basis van al bestaande bedrijfsprocessen. Op basis hiervan zijn er een aantal tests uitgevoerd, waaronder performance- en accuracy-test.
Op basis van het theoretisch onderzoek bleek dat er al groepen onderzoekers bezig waren met deze kwesties. Zo was er ook een aantal tools - dan wel in een vroeg stadium van development – dat hulp kan bieden aan de - binnen het lectoraat DIO aanwezige - problemen. Uit een lijst van potentiële oplossingen, is er gekozen voor OpenRefine en RML-Processor. Deze keuze is gebaseerd op de opgestelde lijst van requirements, waaronder het systematisch en deels automatisch opschonen van grote datasets, en vervolgens het vertalen daarvan naar semantische data, om op tenslotte in een triple store ingeladen te worden. Uit de tests bleek, dat combinatie van OpenRefine en RML-Processor een positieve bijdrage kan leveren aan de bedrijfsprocessen binnen het lectoraat DIO. Deze toepassing zorgt ervoor dat de hoeveelheid werk die handmatig uitgevoerd moet worden, beperkt wordt tot het eenmalig opstellen van een ontwerp/mapping, en het uitvoeren hiervan. Dat is veel efficiënter vergeleken met de huidige aanpak, waarbij deze bewerkingen handmatig uitgevoerd worden.

Toon meer
OrganisatieHZ University of Applied Sciences
OpleidingHBO-ICT
InstituutAcademie voor Technologie & Innovatie
PartnersLectoraat Duurzaam Innoveren en Ondernemen, Vlissingen
Gepubliceerd in
Datum2015-08-28
TypeBachelorscriptie
TaalEngels

Op de HBO Kennisbank vind je publicaties van 25 hogescholen

De grootste kennisbank van het HBO

Inspiratie op jouw vakgebied

Vrij toegankelijk