Published September 14, 2023 | Version 3.0
Technical note Open

Guide de relecture d'un jeu de données avant publication (qualité de l'entrepôt de données DataSuds)

  • 1. Service IST, MCST - IRD - France
  • 1. Service IST, MCST - IRD - France

Description

Dans le cadre d'une démarche Qualité, ce guide technique documente 36 points de vérification (accompagnés de recommandations) destinés aux relecteurs ou « curateurs » de jeux de données (datasets) avant leur publication dans DataSuds (https://dataverse.ird.fr). Entrepôt institutionnel de données scientifiques de l'IRD, DataSuds fonctionne grâce à l'application Dataverse. Le guide peut également être consulté par les déposants de données à la recherche de renseignements sur quelques points précis, de façon à finaliser plus rapidement un jeu de données.

Sous forme de tableau synthétique, le guide est divisé en 3 sections : "Métadonnées" (listées dans l'ordre du formulaire de saisie Dataverse), "Fichiers déposés" et "Conditions d’utilisation". Les principales lignes directrices sont le respect des principes FAIR, des principes Data Citation, la qualité éditoriale et les bons usages. La finalité des recommandations (comprendre le "Pourquoi") est précisée dans une colonne dédiée à cet effet. Des conseils pratiques ainsi que des liens vers des explications plus détaillées sont également fournis. Une grille pratique (checklist) résume ensuite la liste des critères en une page, conçue pour être imprimée.

Dans une approche d'amélioration continue, ce guide a évolué au fil du temps. Certains conseils peuvent sembler évidents. Cependant tous reflètent nos observations, les cas réellement rencontrés durant la révision de 270 jeux de données. Ces éléments peuvent aussi être appliqués aux jeux de données destinés à être publiés dans d'autres entrepôts. Les critères de curation spécifiques à l'entrepôt DataSuds concernent principalement les types de données acceptés (cf. F1) et leur volume (F2).

 

Sommaire

  • Tableaux de recommandations destinés à la vérification des métadonnées, des fichiers déposés et des conditions d’utilisation, accompagnés de conseils pratiques et de justifications.
  • Grille de relecture d’un jeu de données (checklist) : une page à imprimer.
  • Annexe 1. Conseils de mise en œuvre.
  • Annexe 2. Présentation introductive : « Pourquoi et Comment publier un jeu de données dans une démarche guidée par la qualité ? ».
  • Annexe 3. Ressources & liens divers.

 

Historique des mises à jour

Version 3.0 FINALE (09/2023)

Dernière version. Ajout d’une page de présentation, de 3 annexes et enfin de divers détails dans les sections F1, F13, F14, L1 et L2. 

Version 2.8 (02/2023)

 

Informations ajoutées (surlignées en jaune) dans les sections "Description", "Choix des fichiers", "Format des fichiers", "Attribution de licences". Mise à disposition de la version Word du document afin de faciliter son réemploi (licence CC-BY-SA).

Version 2.7 (12/2022)

Précisions, clarifications et reformulations. Une attention particulière est portée à la concision du guide, de sorte que le nombre de pages reste inchangé.

Version 2.6 (08/2022)

Ajout de quelques précisions.

Version 2.5 (07/2022)

 

La grille (page 8) a été révisée en fonction de son expérience d'utilisation : une nouvelle colonne "Edité" aide à tracer les modifications apportées au jeu de données, afin de les rapporter ensuite au déposant ; une autre colonne est à présent destinée à répertorier les questions à poser au déposant.

... / ...

 

 

Version 1.0 (01/2021)

 

La première version du guide a été produite en janvier 2021 et diffusée initialement au réseau des référents Données Scientifiques de l'IRD.

 

Remerciements

Hanka Hensens, Caroline Doucouré et Pascal Aventurier (Service IST, MCST, IRD) ont contribué à la révision de versions antérieures (1.0 - 2.4) de ce guide.

 

Notes

Licence CC-BY-SA

Files

DataSuds_qualite_depots_2023v30.pdf

Files (1.5 MB)

Name Size Download all
md5:9ebb3f425e6bd13c8b061f08fe253ac2
530.6 kB Download
md5:3f8dbf72f4d2dad339d66195b688cc58
969.7 kB Preview Download

Additional details

References

  • FAIRsharing.org: DataSuds (IRD), DOI: 10.25504/FAIRsharing.7c255a