Kick-off CLARIAH demonstratieproject Oral History Today

Maandag vond bij het Meertens Instituut de kick-off plaats van een vijftal CLARIAH ‘demonstrator’ projecten. Het CLARIAH project heeft als doel een digitale infrastructuur te bouwen voor onderzoek in de Geesteswetenschappen. In 2012 is CLARIAH op de “Nationale Roadmap ICT grootschalige onderzoeksfaciliteiten” geplaatst die het opzetten of verbeteren van grote onderzoeksfaciliteiten stimuleert. Met een ‘startsubsidie’ (zaaigeld) kan CLARIAH projecten ontwikkelen om een nieuwe roadmap-aanvraag in oktober 2013 te ondersteunen. In februari zijn vijf van dit soort ‘demonstrator’ projecten van start gegaan bij het IISG, DANS, Meertens Instituut en Beeld en Geluid. Maandag was de kick-off van deze projecten. Eén ervan is het ‘Oral History Today‘ project dat nauw verbonden is aan Verteld Verleden.

Onderzoekstool voor Oral History

Het doel van Oral History Today is de ontwikkeling van een tool om beter audiovisuele bronnen te kunnen betrekken bij het onderzoek van Geesteswetenschappers. Zoals de naam  al aangeeft, kijkt het project binnen het audiovisuele domein specifiek naar Oral History. Bij de ontwikkeling van de tool werken de onderzoekers samen met een team van ontwikkelaars toe naar een eindproduct dat demonstreert hoe Oral History in het bijzonder en audiovisuele content in het algemeen kan worden ingezet voor onderzoek in de geesteswetenschappen door gebruik te maken van de technische mogelijkheden die er zijn. Het project maakt hierbij gebruik van de Oral History collecties die binnen Verteld Verleden beschikbaar zijn. De tool zal als een alternatieve portal van Verteld Verleden beschikbaar worden gemaakt.

Fasen van onderzoek

Bij het ontwikkeling van de tool wordt uitgegaan van vier fasen in onderzoek dat gebruik maakt van audiovisuele bronnen: een exploratieve fase waarin een archief wordt geraadpleegd om tot een selectie relevante bronnen te komen (selectiefase), een fase waarbij ingezoomd wordt op de geselecteerde bronnen en een onderzoeksvraag wordt beantwoord (analysefase), een fase waarin de resultaten van het onderzoek worden gepresenteerd (presentatiefase), bijvoorbeeld via een verrijkte publicatie, en tenslotte een curatiefase, waarbij voor zover mogelijk alle gebruikte en gegenereerde dataverzamelingen en onderzoeksresultaten duurzaam worden opgeslagen. Oral History Today richt zich met name op de eerste twee onderzoeksfasen.

Selectie van audiovisuele bronnen

Foto: http://www.flickr.com/photos/tonicito/De tool die in het project wordt gebouwd moet  de onderzoeker vooral gaan helpen bij het selecteren van audiovisuele bronnen en het analyseren van deze bronnen. Denk hierbij voor de selectiefase aan mechanismen om een goed beeld te krijgen van de inhoud van een audiovisueel archief, bijvoorbeeld door inzicht te geven in de thema’s, tijdsperiodes, collectiebeheerders, locaties en onderzoekers die verbonden zijn aan de bronnen (vensters op de data).  Natuurlijk kan een gedegen zoekfunctionaliteit met filteropties (facetten) op basis van de beschikbare metadata niet ontbreken. Het kunnen bewaren van geselecteerde bronnen in een persoonlijke folder, het kunnen opslaan (loggen) van het zoekproces, en mogelijkheden om aantekeningen en persoonlijke annotaties toe te voegen, zijn andere functionaliteiten waaraan gedacht kan worden.

Inzoomen op selecties

In de tweede fase wordt dieper ingezoomd op de geselecteerde bronnen en dan kunnen hulpmiddelen om (semi-)automatisch onderdelen van de collectie te clusteren of dwarsverbanden aan te geven nuttig zijn. Natuurlijk kunnen ook hier gedetailleerde zoek- en filteropties niet ontbreken. Het ligt echter voor de hand dat in de selectiefase het zoeken op documentniveau (het zoekproces levert als resultaten de complete interviews als geheel op) belangrijker is, terwijl in de analysefase het zoeken op fragmentniveau (het zoekproces levers als resultaten fragmenten uit interviews op die relevant zijn gegeven de zoekvraag) nuttig kan zijn. De mogelijkheid om op fragmentniveau te kunnen zoeken wordt overigens wel bepaald door de beschikbare informatie in de metadata. Zonder tijd-gecodeerde annotaties (bijvoorbeeld afkomstig uit spraakherkenning) kan alleen op documentniveau worden gezocht.

Terwijl in de selectie-fase geselecteerde bronnen in grotere aantallen en als gehele bestanden worden opgeslagen in een persoonlijke werkruimte, zal voor de analyse-fase de bewaarfunctie moeten worden verfijnd om op een gedetailleerder niveau te kunnen werken. Het (virtueel) kunnen knippen en bewaren van fragmenten behoort hier tot de opties, maar ook het maken van aantekeningen, het toevoegen van annotaties en middelen om samen te werken met collega’s (bijvoorbeeld het delen van de werkruimte) kunnen een nuttige bijdrage leveren aan het analyse-proces. Tenslotte kan er worden gedacht aan het visualiseren van patronen of sleutelbegrippen in de data. Voor de hand liggende voorbeelden zijn woordenwolken op document- en fragmentniveau en op tijd en woordfrequentie gebaseerde diagrammen zoals de bekende google n-gram viewer.

Projectgegevens
Het Oral History Today project is gestart op 14 februari 2013 en zal worden afgesloten met de presentatie van de tool in september 2013. Beeld en Geluid is penvoerder van het project en coördineert de Verteld Verleden infrastructuur, Erasmus Universiteit Rotterdam organiseert de bijdrage van de Oral History onderzoekers aan de ontwikkeling van de tool, en de bedrijven Spinque en Dispectu verzorgen de ontwikkeling van respectievelijk de zoekfunctionaliteiten en de gebruikersinterface. Contactpersoon: Roeland Ordelman.