Folksonomy

Dit artikel is ook gepubliceerd in het tijdschrift InformatieProfessional, jaargang 9, nummer 7/8 (juli/augustus 2005).

Auteurs: Sybilla Poortman & Gerard Bierens


Inhoud

Inleiding

De behoefte om informatie te ordenen zodat ze ‘beheersbaar’ wordt, resulteert vaak in een top-down aanpak zoals bibliotheeksystemen die kennen. Betrekkelijk nieuw is de bottom-up aanpak, metadatering gebaseerd op het sociale aspect van consensus. Sybilla Poortman en Gerard Bierens zoomen in op de achtergronden van folksonomy en nemen de nieuwe 'sociale' tools onder de loep met aandacht voor toepassingsmogelijkheden in de bibliotheekomgeving. En ook: folksonomy versus taxonomie, samen door één deur of ieder een eigen ingang?

Folksonomy, ofwel metadatering door de massa, ontwikkelt zich in hoog tempo als krachtig hulpmiddel bij het zoeken, ordenen en beheren van informatie op internet. Het ontstaan ervan heeft alles te maken met liberalisering van kennis die niet langer geïsoleerd bij een individu aanwezig is, maar steeds vaker informeel ontstaat tussen personen binnen een collectief netwerk. De gebruiker plaatst zichzelf daarbij op de stoel van de informatiespecialist, een ontwikkeling die door velen in het vakgebied met argwaan bekeken worden. Nochtans begint het er steeds meer op te lijken dat taxonomie en folksonomy niet tegengesteld maar juist complementair zijn. Aanwijzingen daarvoor zijn te vinden in social software toepassingen, waarbij taxonomie en folksonomy steeds vaker hand in hand gaan. Wie zélf content toevoegt aan internet -of content van anderen wil vastleggen- kan social bookmarking tools gebruiken om content te voorzien van ‘vaste’ metadata in combinatie met zogeheten ‘tags’, ofwel zelfgekozen ‘vrije’ trefwoorden.

Metadata

De begrippen ‘metadata’ (data over data ofwel informatie over informatie) en ‘tags’ (labels, trefwoorden) kwam je tot voor kort voornamelijk tegen in bibliotheekcontext. Kenmerkcodes die worden gebruikt om materialen als boeken en videobanden te ontsluiten zijn in feite metadata-velden. Ze geven informatie over de informatiedrager; materiaalsoort, ISBN, uitgever, jaar van publicatie, formaat, aantal bladzijden, systeemvereisten (bij digitale materialen), trefwoorden en samenvatting. Deze metadata-velden ontsluiten de materialen op verschillende niveaus:

  • de precieze informatiedrager vinden (ISBN)
  • informatiedragers over een bepaald onderwerp vinden (trefwoorden)
  • aantal gevonden informatiedragers over een bepaald onderwerp beperken of sorteren (materiaalsoort, jaar van publicatie)

Hierbij wordt vaak gebruik gemaakt van taxonomieën, directory-achtige boomstructuren waarbij informatie van algemeen naar specifiek wordt omschreven. Op vrijwel alle niveaus van deze boomstructuren zijn de te gebruiken datavelden vastgelegd. Uiteraard zal een informatiespecialist bij het toekennen van trefwoorden zoveel mogelijk rekening willen houden met de doelgroep om –binnen de vastgestelde kaders- de collectie zo optimaal mogelijk toegankelijk te maken. Dat maakt catalogi tot een krachtig hulpmiddel bij het zoeken naar specifieke informatie. Toch is deze kracht van de bibliotheekcatalogus ook weer relatief. Wie niet voldoende op de hoogte is van de achterliggende classificatieregels en richtlijnen voor catalogisering kan hopeloos en hulpeloos dwalen door een goed gevulde catalogus zonder uiteindelijk de gezochte materialen te vinden. Met andere woorden: wie hier niet het juiste trefwoord weet, komt moeizaam of misschien wel nooit bij de gewenste informatie.

De opkomst van social software

Met de opkomst van social software is het toekennen van trefwoorden (taggen) niet meer alleen voorbehouden aan de speciaal daarvoor opgeleide bibliothecaris. Metadateren wordt hoe langer hoe meer ook door individuele gebruikers toegepast, dit heeft alles te maken met de alsmaar groeiende informatiestromen en het willen delen van kennis als informatie in een afgebakende, voorgefilterde vorm. Die kennis is niet langer geïsoleerd aanwezig bij één persoon maar ontstaat steeds vaker tussen personen, binnen al dan niet georganiseerde netwerken. Wie eigen kennis deelt, verwacht daar ook kennis voor terug te krijgen. Hetzij in de vorm van stukjes nieuwe informatie, hetzij als aanvullingen of correcties op de eigen kennis.

Tegelijkertijd is er een verschuiving gaande van het opslaan en beheren van bestanden op de eigen pc naar het web zelf. Deze verschuiving heeft enerzijds te maken met de toename van databestanden op onze pc’s en anderzijds met de behoefte om vanaf meerdere plekken deze bestanden te kunnen benaderen. Een en ander stelt uiteraard andere eisen aan het kunnen terugvinden van de data. Neem als voorbeeld de vlucht die digitale fotografie heeft genomen. Waar laat je al die foto's? Liever niet langer lokaal maar juist online; het internet is, in tegenstelling tot je harde schijf, overal en altijd beschikbaar. De foto-site Flickr.com speelt slim in op die snel groeiende behoefte en biedt gratis online opslagruimte: 10 Mb per maand, en dat in combinatie met geavanceerde instrumenten om fotoverzamelingen te kunnen beheren en organiseren. Heel aardig, maar toch zijn dit niet de voornaamste succesfactoren. Bij Flickr draait alles namelijk om tags. Waar je op je eigen pc vaak nog moet volstaan met een map ‘vakantie Toscane’, kun je online elke foto apart (of per serie) tags geven waarmee je de foto(serie) omschrijft. Zo kun je alle foto's van je hond in één zoekopdracht terugvinden terwijl je anders in heel veel mappen en submappen zou moeten gaan speuren.

Bijkomend voordeel (en dat is waar folksonomy om de hoek komt kijken) is dat ook anderen met behulp van die tags jouw openbare foto's terug kunnen vinden. Dat maakt Flickr tot zogenaamde social software. Wie deze sociale functie van het taggen in het achterhoofd weet te houden, zal minder snel de tag ‘Wodan’ gebruiken, maar juist kiezen voor de tag ‘hond’, of ‘dog’ vanwege het internationale karakter van Flickr.

Afbeelding:Flickr.jpg

Wat is folksonomy?

Folksonomy is een vorm van taxonomie door het volk en ontstaat dus grotendeels door consensus (vgl. ‘The Wisdom of Crowds’ van James Surowiecki : de massa met gemiddelde kennis komt tot juistere uitkomsten dan het individu). Naast voordelen als een grote mate van flexibiliteit, betrokkenheid van gebruikers en actualiteit, levert dit ook nadelen op. Ongecontroleerde trefwoordenlijsten zijn onoverzichtelijk en trefwoorden van andere gebruikers zetten je nog wel eens op het verkeerde been. Doordat er ook geen verdiepende niveaus zijn, maakt het geheel al snel een chaotische indruk. Het succes van folksonomy staat of valt dan ook met de bereidheid van een grote groep gebruikers om bruikbare tags aan hun documenten toe te kennen. Waar top-down opgelegde metadatering nogal eens op weerstand en/of belemmeringen stuit, blijkt deze bottom-up benadering wonderwel te werken. De beste verklaring daarvoor is voor de hand liggend: de trefwoorden die je zelf toekent zijn immers vaak dezelfde trefwoorden als de trefwoorden waarmee je zou zoeken naar de gewenste informatie.

Bij het voorbeeld uit de inleiding zal de tag ‘dog’ het winnen van de tag ‘hond’ als de gebruiker merkt dat er meer foto's met hetzelfde onderwerp deze tag hebben gekregen. Niet alleen vindt hij zelf gemakkelijker foto’s van honden met de Engelstalige tag, ook anderen kunnen zijn foto’s sneller vinden met deze tag. Om bij het voorbeeld te blijven: op het moment van schrijven leverde de tag ‘dog’ 2899 treffers in Flickr op, tegenover 1086 treffers voor de tag ‘dogs’, een logisch voortvloeisel uit de bijna organisch opgebouwde taxonomie. Opvallend, want gestructureerde taxonomieën en directories gebruiken in het algemeen juist trefwoorden in meervoudsvorm.

Bij folksonomy maakt men dus op een andere manier gebruik van data-verzamelingen. Hoe groter het collectief, hoe groter de concensus, en dus zal ook het gemeenschappelijk rendement van ‘vrij’ toegekende trefwoorden steeds groter worden. In plaats van met een zoekmachine te zoeken naar trefwoorden (breed, veel ruis, rijp en groen, actueel of door linkrot niet meer aanwezig, en dit alles door elkaar) kan nu doelgericht gezocht worden naar een tag en dat binnen een min of meer afgebakende informatiestroom. De gebruikte tag relateert namelijk niet alleen diverse documenten aan elkaar, maar brengt ook de gebruikers in beeld die eenzelfde tag hebben toegepast. De verzamelingen van (mede)gebruikers kunnen weer gebruikt worden om meer interessante informatie over dezelfde of vergelijkbare onderwerpen te vinden. Bovendien genereren de meeste social bookmarking tools ook automatisch nuttige aanbevelingen op grond van de inhoud van een persoonlijke collectie.

Social Bookmarking

De tijd dat we steeds met één en dezelfde pc werkten, ligt met de komst van internet alweer ver achter ons. Email lezen doe je tegenwoordig dan ook thuis, op kantoor, onderweg of zelfs op vakantie. Niet alleen webmail, maar ook andere bedrijfsapplicaties zijn steeds vaker benaderbaar via het web, wat weer bijdraagt aan een verhoogde mobiliteit. Vervelend neveneffect van dat webbased werken is dat al die URL’s telkens op iedere pc weer opnieuw in de favorieten-map vastgelegd moeten worden. Met social bookmarking wordt dat probleem opgelost: favoriete webpagina’s bewaar je niet langer lokaal, maar online. Dat kan op diverse manieren, maar de meest populaire methode is het beheren van favorieten via een zogenaamde online ‘bookmark service’. Die werken vrijwel allemaal volgens dit principe: maak eenmalig –kosteloos- een account aan bij zo’n bookmark service, en installeer een bookmarklet in de werkbalk van de webbrowser. Telkens wanneer je daarna een interessante website tegenkomt is een klik op het ikoontje in de browser-werkbalk voldoende om de gevonden webpagina in je persoonlijk online archief te bewaren.

In eerste instantie lijkt dit niet meer dan een vervanging van het pc-gebonden favorietenlijstje, maar niets is minder waar. De meerwaarde zit hier namelijk in de kracht van het grote getal. De vele persoonlijke archieven vormen tezamen namelijk de kern van één grote collectieve repository. Juist omdat alle content online bewaard wordt kunnen ieders favorieten gedeeld, vergeleken en in relatie gebracht worden met de vondsten van anderen. Dat gebeurt op basis van metadata, data over data. Die wordt deels uit de vaste elementen van een bron gehaald (titel, URL, …) en daarnaast verder aangevuld door de gebruiker. Met name het toekennen van trefwoorden (tags) is hierin belangrijk, want gemeenschappelijke trefwoorden vormen weer de basis van collectieve interessegebieden. Even grasduinen binnen zo’n interessegebied levert vaak waardevolle nieuwe informatie op -en meer dan dat- er ontstaan als vanzelf relaties tussen bronnen, ranglijsten van populaire bronnen en waardevolle connecties met andere gebruikers van het systeem.

Tools

Furl.net

Het vastleggen van nieuwe bronnen in Furl is een eenvoudig proces. Met behulp van de eerder genoemde bookmarklet wordt een invulformulier geopend waarin een aantal standaardwaarden al zijn ingevuld. De gebruiker kan deze metadata-set direct aanpassen, aanvullen en toevoegen aan het persoonlijk archief. Het aardige van Furl is dat het een oplossing heeft gevonden voor het linkrot-probleem. Een kopie van elk webdocument wordt in een persoonlijk archief (maximaal 5 Gb) opgeslagen en blijft dus beschikbaar, ook als de oorspronkelijke pagina ondertussen van internet is verwijderd. Gefurlde bronnen kunnen overigens ook achteraf altijd nog aangepast worden. Bookmarks uit IExplorer of Firefox zijn eenvoudig te importeren en ook exportmogelijkheden zijn er meer dan voldoende, onder andere naar BibTex en EndNote. Zodra een persoonlijk Furl-archief enigszins is gevuld, gaat Furl automatisch op zoek naar andere interessante bronnen binnen je interessegebied. Hetzelfde doet Furl voor ‘gelijkgestemden’, de personen die vergelijkbare bronnen vastleggen als jijzelf worden keurig in beeld gebracht: je ‘furlmates’. Wie zich wil abonneren op (delen van) archieven van andere gebruikers kan dat zowel via e-mail als RSS doen.

Del.icio.us

De mogelijkheden van del.icio.us steken op het eerste oog wat schril af bij die van Furl, maar daar staat tegenover dat del.icio.us kan bogen op een grote en actieve community. Ook gaat de ondersteuning voor RSS nét even iets verder dan bij Furl: werkelijk alle in del.icio.us bestaande contentvormen worden aangeboden in RSS. Je kunt jezelf via RSS abonneren op tags (trefwoorden), populaire tags, gecombineerde tags, personen, populaire personen en ga zo maar door (http://del.icio.us/rss/popular toont bijvoorbeeld de momenteel meest populaire bookmarks en tags). Dan is er ook nog de onlangs vrijgegeven del.icio.us API, hiermee worden door derden voortdurend nieuwe additionele del.icio.us-componenten ontwikkeld. Voor de gebruiker betekent dit toegang tot een brede verzameling van op del.icio.us gebaseerde toepassingen. En tenslotte een ook niet onbelangrijk punt, del.icio.us is (in tegenstelling tot Furl) niet opgezet vanuit een commercieel oogpunt.

Flickr.com

Flickr biedt mogelijkheden om grafische bestanden online te bewaren. Iedere afbeelding kan worden voorzien van een titel, beschrijving en trefwoorden. Tegelijkertijd wordt ook alle EXIF-data vastgelegd. EXIF staat voor Exchangeable Image File, deze in ieder JPEG-bestand aanwezige metadata-set legt van iedere afbeelding een groot aantal eigenschappen vast. Type camera, resolutie, datum van opname, datum van plaatsing, afbeeldingdimensies en zo nog veel meer. Afbeeldingen kunnen worden ondergebracht in sets, die zowel privé als openbaar kunnen zijn. Het is mogelijk om op basis van trefwoorden te browsen (meer foto's zoeken met hetzelfde trefwoord), maar ook het bekijken van afbeeldingen in een tijdsbalk is op basis van de plaatsingdatum mogelijk. Men kan eigen foto’s voorzien van notitiekaders en commentaar leveren op andermans foto's. Ook rating (beoordeling) is mogelijk, door foto's als persoonlijke favoriet te kiezen. Attenderingsmogelijkheden zijn er volop, met uiteraard een hoofdrol voor RSS-feeds. Wie foto’s wil delen met anderen kan eigen foto’s vrijgeven (vrienden/familie/iedereen), maar ook deelnemen aan collectieve groepen rondom een bepaald onderwerp of thema, zoals bijvoorbeeld ‘Librarians Desks'. Fascinerend is de altijd in beweging zijnde tag cosmos (trefwoordenwolk), een mooie graadmeter waaruit actuele trends kunnen worden afgeleid.

Connotea.org

Afbeelding:Connotea1.jpg

Waar Furl, del.icio.us en Flickr een vooral zo breed mogelijk publiek aanspreken, is Connotea juist bedoeld voor een specifieke doelgroep, namelijk wetenschappers. In de verte heeft het wel wat weg van EndNote, geen onbekende toepassing voor informatiespecialisten. Connotea past dan ook prima bij het profiel van de informatiespecialist, en niet alleen omdat persoonlijke archieven ‘My Library’ als titel meekrijgen. De nadruk ligt namelijk niet zozeer op het vastleggen van webpagina’s, maar is juist heel specifiek gericht op het vastleggen van bibliografische gegevens van artikelen, boeken en andere (wetenschappelijke) publicaties. Dat komt vooral tot uiting in de koppeling met de bestanden van uitgeverijen als Nature.com, PubMed, D-Lib Magazine en zelfs Amazon.com. Wie artikelen uit deze databases in Connotea wil vastleggen, krijgt automatisch de inhoud van de beschikbare metadata-velden meegestuurd. Daarna kan de beschrijving worden aangepast of aangevuld en (uiteraard) voorzien worden van trefwoorden. Een ander aardig aspect is de mogelijkheid om samen te werken in al dan niet afgeschermde ‘User Groups’. En zoals het hoort bij bibliotheekgeoriënteerde omgevingen, kan Connotea overweg met booleaanse zoekoperatoren en andere geavanceerde zoekmethoden.

Toepassingen in de bibliotheek

Er zijn een aantal impliciete en expliciete toepassingen binnen het werkveld van de informatiespecialist te bedenken. Het zelf toekennen van trefwoorden en het zoeken met behulp van door anderen toegekende trefwoorden scherpt het nadenken over de essentie van een informatiebron. Wie goede trefwoorden toekent, heeft op zijn minst het belangrijkste van het onderwerp gelezen c.q. begrepen. Folksonomy kan daarom een hulpmiddel zijn bij het beoordelen en metadateren van informatiebronnen. De social bookmarking tools bieden zelf mogelijkheden om de meest relevante trefwoorden te vinden, daarnaast leggen ook zoekmachines als Technorati steeds meer de nadruk op tags. De informatiespecialist die niet zo zeker is van het juiste trefwoord of de kwaliteit van een bron kan eerst eens via zo’n service nagaan welke treffers er bij een trefwoord worden gevonden en zo verifiëren in welke mate deze overeenstemmen met de eigen perceptie. Bovendien levert het vaak ook een aantal gerelateerde trefwoorden en andere bronnen op.

Afbeelding:Technorati.jpg

Ook kan de informatiespecialist zijn voordeel doen als actieve gebruiker van social bookmarking tools. Instrumenten als Furl en del.icio.us zijn zodanig flexibel ingericht, dat de informatiespecialist zowel vraaggericht (incidentele vraag om research naar een bepaald onderwerp) als aanbodgericht (pro-actief monitoren van een vakgebied) kan werken. Relevante bronnen op het eigen vakgebied of op het vakgebied van de klant kunnen in een Furl-archief worden gezet (met bijvoorbeeld een onderwerp per categorie). De reeds vermelde mogelijkheden van Furl kunnen helpen om informatiebronnen te vinden en te ordenen. Attendering op maat richting doelgroep is dankzij de ingebouwde RSS-ondersteuning niet langer een utopie. Ieder individu kan zich eenvoudigweg abonneren op de RSS-feed van een betreffende categorie en op plekken waar een breder publiek bediend moet worden kan –ook weer via RSS- de actuele content op een pagina elders getoond worden (bijvoorbeeld op een intranet). Uiteraard bestaat voor de eindgebruiker ook altijd nog de mogelijkheid om het Furl-archief zelfstandig te doorzoeken.

Een goed voorbeeld van folksonomy toegepast in een digitale bibliotheek-omgeving is te zien op de weblog van de gezamenlijke Fontys mediatheken. De informatiespecialisten die in de diverse mediatheken werkzaam zijn hebben domeindeskundigheid op een bepaald onderwijsgebied. Ze houden via de weblog geïnteresseerde collega's, docenten maar ook anderen (de weblog is openbaar) met korte berichten op de hoogte van nieuwe ontwikkelingen binnen dat gebied. Ieder individu kan zich middels RSS abonneren op een algemeen of specifiek kennisgebied en opleidingen kunnen van RSS ook weer (delen van) de content weergeven binnen hun eigen intranetten, leeromgevingen of andere platformen.

Afbeelding:Fontysmediatheekcosmos.jpg

De tag cosmos op de Fontys Mediatheek weblog. De trefwoorden die samen deze lokale tag cosmos vormen worden automatisch gekoppeld aan de universele tag cosmos bij Technorati.

De informatiespecialisten kennen aan hun berichten ook trefwoorden toe die in een zogenaamde tag cosmos (trefwoordenwolk) worden opgenomen. Hoe groter het trefwoord, des te vaker het voorkomt in de berichten op de weblog. Door een trefwoord in die woordenwolk aan te klikken worden alle aan dat trefwoord gekoppelde berichten getoond. Met andere woorden: ze worden door het trefwoord aan elkaar gerelateerd. Het feit dat de trefwoordenwolk zichtbaar is, draagt eraan bij dat auteurs zorgvuldiger de meest logische trefwoorden kunnen kiezen.

Folksonomy versus taxonomie?

De introductie van folksonomy heeft voor een behoorlijke controverse op internet gezorgd. Menig webpublicist (zeker in het informatiedomein) heeft de neiging de nieuwe folksonomy af te zetten tegen de conventionele manieren van organiseren en metadateren. De vraag is of dit wenselijk is. Waarom zou je moeten kiezen? Waarom niet beide op hun merites beoordelen en vervolgens inzetten waar dat het beste uitkomt? Desnoods naast elkaar zoals dat al gebeurt bij Connotea en Flickr. Een aantal vaste metadata-elementen zijn hier al vóóraf vastgelegd. Het betreft hier gestructureerde informatie die automatisch uit de informatiebron kan worden gedestilleerd. Daarnaast kan iedere gebruiker dan nog vrije trefwoorden toekennen die in beginsel allesbehalve gestructureerd zijn maar dit allengs worden door consensus. Deze trefwoorden en de bijbehorende tag cosmos helpen bij associatief -en dus min of meer ongestructureerd- zoeken. Ze helpen je overigens ook te vinden wat je niet zoekt of waarvan je je niet bewust was dat je het zocht (serendipity).

Folksonomy en taxonomie werken elkaar dus niet tegen maar vullen elkaar juist aan. De hele controverse heeft daarom welbeschouwd weinig zin. De combinatie heeft zijn weg al gevonden op internet en zal dat in vele verschijningsvormen blijven doen. De noodzaak schept de variatie en zo hoort het ook bij een internet dat steeds meer door de gebruiker zelf wordt vormgegeven. Dat was immers de droom van Tim Berners-Lee, geestelijk vader van het world wide web. Logisch vervolg zou een geheel geannoteerd web kunnen zijn, waarbij nu nog niet duidelijk is wie dit annoteren gaat doen: de gebruikers, specialisten, het web zelf (via slimme tools die zelf tags genereren) of wellicht toch weer Google?

Aanbevolen literatuur


Over de auteurs

Sybilla Poortman is werkzaam als specialist informatiebemiddeling in het Kennis Logistiek Centrum van Fontys Hogescholen te Sittard. Zij is tevens lid van de kenniskring ‘Educatieve functies van ICT’. Haar weblog is te vinden op: inter-net-viewer.nl/weblog

Gerard Bierens is werkzaam als webcoördinator voor de afdeling Mediavoorzieningen bij Fontys Hogescholen en freelance ICT-auteur. Zijn persoonlijke weblog is te vinden op weblogzonderhaast.nl.

Afkomstig van Fontys Mediatheek Wiki NL, de Vrije Encyclopedie. "http://www.fontysmediatheek.nl/wiki/home/Folksonomy"
Personal tools