Data Doordacht: Strategie voor de omgang met data en software in de wetenschap

Translated title of the contribution: Data Deliberated: Strategy for managing data and software in scholarship

P.K. Doorn, Patrick Aerts

Research output: Working paper/discussion paperWorking paper/Discussion paperProfessional

Abstract

Naar aanleiding van de nadere vaststelling van de strategierol die DANS in het
Nederlandse landschap moet spelen formuleerde de Stuurgroep DANS op 2 juli
2015, in de onderzoekopdracht: “Data-archipel of geordende datapolder?”, een
zevental vragen, die in deze nota Data Doordacht zijn gebundeld in een viertal
hoofdstukken:
1. Algemeen Kader (Framework) en onderzoekersbetrokkenheid;
2. Lacunes in de datadienstverlening per discipline;
3. Infrastructuur voor de archivering, het onderhoud en de beschikbaarstelling van software;
4. RDNL, DANS en Coördinatiepunt RDM.

1. Data Doordacht stelt de rol en de wens van de onderzoeker centraal.
De “vraag” vanuit de onderzoekswereld (zowel naar deponerings- als naar
toegangsmogelijkheden) zou leidend moeten zijn bij de inrichting van data- en
softwarediensten. Om daartoe te komen is een kaderstellend raamwerk (het
Algemeen Kader) nodig om enige orde en een minimum aan uniformiteit te
bereiken dat voor betaalbare duurzaamheid nodig is. Dit Algemeen Kader is nader uitgewerkt en onderscheidt een drietal categorieën belanghebbenden: A)
Overheden, onderzoeksorganisaties, subsidieverleners; B) Maatschappij en
wetenschap; C) Faciliterende, uitvoerende en overige partijen. Door dit kader
krijgen tal van lopende en voorgenomen initiatieven en acties hun natuurlijke rol.
Kernpunten voor dit Kader zijn:
• Behandel data stewardship en software sustainability beleidsmatig op gelijke
voet;
• Beschouw software en dataverzamelingen als waarde-objecten en draag dat ook
zo uit;
• Stel de onderzoeker/onderzoekdisciplines centraal om hun betrokkenheid te
verkrijgen en
• Laat de disciplines zelf omgangsprotocollen uitwerken, rekening houdend met
Open en FAIR-bewegingen;
• Publiceer de protocollen ook voor latere referentie.
Bij de vormgeving van de dienstverlening en de bij het Algemeen Kader benodigde infrastructuur wil DANS een leidende rol spelen in nauwe samenwerking met partijen als SURF en VSNU. Bij die implementatie hoort een samenwerking die een naadloze dienstverlening oplevert.
De uitdagingen bij bewustwording en erkenning van onderzoekersinspanningen
zijn:
• Het opstellen van aansprekende richtlijnen voor software sustainability en data
stewardship;
• Het creëren van laagdrempelige portals en structuren voor duurzame opslag;
• Het ontwikkelen van incentives1 die de betrokkenen wat oplevert;
• Het entameren van het gevoel van gezamenlijke verantwoordelijkheid.

2. Er is over de hele linie een stijgende vraag naar datadiensten, met duidelijke
verschillen tussen de vakgebieden.
De verschillen hebben te maken met de volumes (big data versus long-tail data) en
met vakinhoudelijke verschillen. Maar de eisen van digitale archivering voor de
middellange en lange termijn zijn voor alle vakgebieden betrekkelijk vergelijkbaar.
Inzake de dienstverlening voor de levenswetenschappen zijn er drie alternatieven,
waarvan één het meest rendabel is, mits slim georganiseerd: laat DANS zich
richten op archivering van de long-tail data. Voor Big Data kunnen in RDNL-verband
oplossingen worden ontwikkeld. Dat niet alle data voor een bepaald vakgebied op
één plek of door één instelling is opgeslagen komt vaak voor, zowel binnen
Nederland als internationaal. Dit wordt opgelost door de metadata van
verschillende instellingen te aggregeren en presenteren in portalen als NARCIS en
OpenAire, of in disciplinegerichte zoekdiensten. Meer in het algemeen zoekt DANS de ruimte om klanten te bedienen op basis van een concrete vraag naar diensten, inclusief het “dark archive”.

3. Met betrekking tot software sustainability wordt voorgesteld te werken aan een
software sustainability initiatief, gebaseerd op, maar niet noodzakelijk gelijk aan
het Software Sustainability Institute in het VK.
Ook worden de aspecten die een rol spelen bij de invoering van een Software Seal
of Approval met andere partijen bekeken.

4. Inzake het Coördinatiepunt RDM, dat de VSNU aan SURF heeft gevraagd op te
zetten, werkt DANS graag vanuit een gelijkwaardige positie mee aan het
Coördinatiepunt.
Daarmee kan DANS als brug de belangen van NWO, KNAW en de instituten dienen
en in het bijzonder daarbij het perspectief van de onderzoekers en de onderzoekersbetrokkenheid inbrengen. Inzake RDNL is de visie, dat RDNL een meer solide basis zou moeten krijgen dan de huidige letter of intent, dat het de rol moet houden van tweedelijns serviceprovider, met als doel om in gezamenlijkheid een naadloze dienstverlening tot stand te brengen. Daarvoor kan uitbreiding met andere partners nodig zijn. RDNL is een succes als RDNL door instellingen en koepelorganisaties gezien wordt als een belangrijk adviesorgaan en/of partner op het gebied van data stewardship; als de partners van elkaars expertise nuttig gebruik maken; als de partners van elkaars netwerk nuttig gebruik maken; als gezamenlijk optreden (kosten)efficiënter is dan afzonderlijk optreden. RDNL en het Landelijk Coördinatiepunt zullen hun activiteiten nog nader moeten afbakenen.
Translated title of the contributionData Deliberated: Strategy for managing data and software in scholarship
Original languageDutch
Pages1-38
Number of pages38
Publication statusPublished - Jan 2016

Keywords

  • research data
  • software sustainability
  • Research data management

Cite this