Published August 21, 2019 | Version v1
Report Open

Verkenning mogelijkheden automatisch metadateren

Description

Hoe kunnen we het beschrijven van publicaties vergemakkelijken met behulp van slimme technieken? Dit is een van de onderzoeksvragen van de KB Onderzoeksagenda waar we de komende jaren een antwoord op willen geven.

Momenteel vindt het beschrijven van publicaties, ook wel metadateren of titelbeschrijven genoemd, binnen de Koninklijke Bibliotheek deels handmatig plaats en deels door het overnemen van gegevens die we verkrijgen via andere bronnen. Mede door de groei van digitaal vervaardigd materiaal (born digital) en de groeiende opslag van websites, verwachten we de komende jaren meer publicaties dan voorheen te willen bewaren.

Daarom verkennen we de mogelijkheden om het handmatig beschrijven van publicaties te optimaliseren. Twee ontwikkelingen bieden kansen: de groeiende stroom volledig digitaal beschikbare publicaties en het feit dat we door slimme technieken uit onder andere de Kunstmatige Intelligentie, waaronder machine learning, steeds beter in staat zijn om die digitale teksten door de computer te laten interpreteren.

In dit whitepaper geven we de stand van zaken van onze eerste verkenningen van de mogelijkheden van het automatisch metadateren van publicaties. Eerst geven we een overzicht van de manieren waarop organisaties en bedrijven buiten de Koninklijke Bibliotheek bronnen zoals nieuwsartikelen, boeken, tv-uitzendingen of foto’s slim analyseren en beschrijven. Daarna bespreken we hoe we op dit moment binnen de Koninklijke Bibliotheek titels beschrijven, om aan te kunnen geven waar in het proces we de mogelijkheden van automatische metadatering verkennen. In het derde hoofdstuk bespreken we resultaten van onze eigen experimenten met het automatisch toekennen van trefwoorden aan publicaties. We sluiten af met de lessen die we tot nu toe geleerd hebben en beschrijven onze volgende stappen.

Een Engelse versie van dit whitepaper is beschikbaar via https://zenodo.org/record/3375192

Files

KB_Whitepaper_Verkenning automatisch metadateren_HR-PRINT.pdf