Le paysage changeant des données de recherche


Données numériques vertes sur fond noir

Une gestion et une surveillance solides des données sont essentielles lorsqu’il s’agit de réutiliser les actifs numériques savants. Sans un cadre rigoureux et stable en place, la possibilité de stimuler la découverte et l’innovation devient limitée.

C’est pourquoi les principes de données FAIR ont été publiés en 2016 – pour fournir une solution pour améliorer la réutilisabilité des données, avec un accent particulier sur les machines capables de localiser, d’utiliser et de permettre la réutilisation automatique des données lorsque cela sera nécessaire à l’avenir. .

Le thème pour Contech 2021 était, ‘Que signifie la transformation numérique dans le contexte de FAIR Data ?’. La qualité et la gestion des données prenant de plus en plus d’importance dans les communautés de l’édition savante et de la recherche, nous souhaitons revoir les principes de données FAIR. Dans cet article, j’explorerai les quatre éléments des principes de données FAIR et examinerai certains points clés liés à la gestion des données, y compris les données ouvertes/FAIR.

Les principes de données FAIR

En 2016, revue en libre accès Données scientifiques a publié les principes directeurs FAIR pour la gestion et l’intendance des données scientifiques. Les auteurs ont décrit un cadre pour améliorer la trouvabilité, l’accessibilité, l’interopérabilité et la réutilisation (FAIR) des actifs numériques.

Nous résumons chacun des quatre éléments FAIR :

1. Trouvable

Un élément essentiel de la réutilisation des données est la capacité à les retrouver. Le processus de localisation des données et des métadonnées doit être simple pour les humains et les ordinateurs. Ceci est particulièrement important pour ces derniers, car l’indexation correcte des données et des métadonnées permet une découverte automatique.

2. Accessibilité

La prochaine étape des données FAIR consiste à s’assurer qu’elles sont accessibles aux utilisateurs. Il doit être récupérable, et cela peut être fait par authentification et autorisation.

3. Interopérable

Les données doivent être basées sur un langage standardisé pour permettre une intégration transparente et un fonctionnement au sein d’autres ensembles de données, flux de travail et systèmes.

4. Réutilisable

La réutilisabilité est au cœur des données FAIR et peut être obtenue en ayant des données et des métadonnées richement décrites. En rendant les données réutilisables, elles peuvent être appliquées dans de futures recherches.

Pourquoi la qualité et la gestion des données sont-elles si importantes ?

« La création et la consommation de contenu évoluent plus rapidement que jamais, ce qui a un impact sur les modèles commerciaux, les modèles de comportement et pratiquement tous les aspects du rôle de l’information scientifique. »

SOURCE: ConTech 2021

Image colorée de tableaux et de graphiques

Le paysage de la recherche est en constante évolution et croissance. Si cette vaste banque de connaissances scientifiques doit être maintenue et utilisable à l’avenir, il doit y avoir des normes qui peuvent être appliquées aux données entourant la recherche. Les principes de données FAIR sont un exemple d’une façon d’aborder l’élaboration de normes de données.

  • Le site Web d’Ulrich affiche les enregistrements de plus de 48 000 revues savantes actives et évaluées par des pairs dans toutes les langues.

  • En 2020, les données Scopus disponibles via SCImago montraient 4,2 millions d’enregistrements dans la catégorie « documents citables », qui comprend des articles, des critiques, des actes de conférence et de courtes enquêtes.

SOURCE : STM Global Brief 2021 – Économie et taille du marché

En s’assurant que les données sont stockées et gérées selon des normes élevées, les chercheurs, les institutions, les bailleurs de fonds et les éditeurs peuvent être sûrs que les données peuvent être consultées et exploitées dans les recherches futures.

Comment les chercheurs peuvent-ils protéger leurs propres données scientifiques ?

De grands changements sont nécessaires pour améliorer la qualité et la gestion des données dans leur ensemble, et ces changements seront impulsés par les bailleurs de fonds et les éditeurs. Cela dit, les individus peuvent prendre de nombreuses mesures pour assurer la pérennité de leurs propres données de recherche :

1. Créer un plan de gestion des données de recherche

2. Renseignez-vous sur les politiques de données de l’établissement

3. Conservez des versions clairement étiquetées des données

4. Utilisez des formats de fichiers ouverts

5. Stockez les données avec un service de stockage en nuage réputé ainsi que localement

Explorez d’autres conseils de gestion des données avec Editage et rappelez-vous qu’il est important de choisir des pratiques durables et qui ne dépendent pas d’un temps d’administration excessif :

« Pour commencer, nous vous suggérons de rester simple, d’utiliser quelques outils et de vous concentrer sur les fondamentaux – soyez intelligent avec le temps dont vous disposez. »

La nouvelle alchimie : réseautage en ligne, partage de données et outils de distribution des activités de recherche pour les scientifiques, Antony J. Williams, Lou Peck, Sean Ekins, 2017

Le cas des données ouvertes/équitables

Graphiques à barres et à vagues comme visualisation des données

Le mouvement des données ouvertes/équitables se développe rapidement. Les chercheurs savent à quel point leurs données sont précieuses et souhaitent les partager sans obstacles pour créer des opportunités de rétroaction, de collaboration et de recherche de suivi.

Il existe des inquiétudes généralisées quant à l’incohérence de la qualité et de la longévité des données de recherche. S’appuyant sur le billet de blog original de 2015, un ensemble de professionnels, dont ceux de Crossref, California Digital Library, DataCite, eLife et Dryad, se sont réunis pour créer les principes de l’infrastructure universitaire ouverte (POSI).

« … les principes POSI sur la gouvernance, la durabilité et l’assurance des infrastructures ouvertes sont des sujets que l’IOI espère étudier et aborder dans le cadre de son nouveau plan stratégique. La raison même de l’existence de l’IOI et d’initiatives connexes telles que SCOSS est une reconnaissance de la vulnérabilité actuelle des infrastructures ouvertes et de l’insuffisance des mécanismes de financement disponibles pour ces infrastructures.

Il est maintenant temps de travailler ensemble vers des infrastructures ouvertes pour les métadonnées savantesBlogue LSE Impact, 2021

La qualité et la gestion des données de recherche, en particulier les données ouvertes/FAIR, ne feront que gagner en importance pour les communications et la recherche savantes. Nous publierons bientôt les résultats récents de notre projet Research Data Management (RDM), sponsorisé par EBSCO, ainsi que les résultats de notre atelier RDM à Researcher to Reader 2022.

Inscrivez-vous à notre newsletter pour être informé de la publication des résultats.