Pas de billet depuis 4 mois, mais je n’ai pas oublié ce blog – reprenons donc les rapports de conférences de l’été dernier avec celui-ci, dédié à la session « données de la recherche ».
The Role of Libraries and Librarians in Scientific and Technological Data Management and Archiving –
Data sets are increasing in importance around the world. Funding agencies are adopting policies that the research article and data associated therewith must be publicly accessible. Additionally, at the end of the research funding period, the entire dataset must be available as well. To insure proper identification, access, and preservation of the data set the principles of library and archival sciences must be applied to assist researchers to comply with these policy requirements and to establish new best practices within their disciplines. This program will focus on the issues raised by these expanding roles of Libraries and Librarians in the data management process.
Quatre interventions, dont certaines consultables en ligne. C’est parti !
re3data and an Ecosystem of Research Data Repositories – Michael Witt (in collaboration with Mustapha Mokrane, Heinz Pampel, Frank Scholze, Robert Ulrich)
Pourquoi partager les données de la recherche ? Gage de sérieux pour la recherche scientifique (examiner les données permet de critiquer les résultats obtenus), c’est également un progrès majeur dans le monde de l’open access. De nombreux organismes finançant la recherche exigent aujourd’hui une telle mise à disposition, et pour certains chercheurs, fournir des données qui pourront être réutilisées est également une source de réputation.
Le site re3data vise à recenser les serveurs de dépôt de données de recherche de toutes les régions géographiques et toutes les disciplines. Ceux-ci sont qualifiés par des descripteurs / mots-clefs qui devraient idéalement permettre à chacun de trouver l’hôte idéal pour ses données.De plus, les licences et autres détails sont standardisés et représentés par des pictogrames visant à simplifier la compréhension des particularités de chaque hôte.
Ce site m’a paru incontournable pour tout bibliothécaire académique en contact avec des chercheurs se posant des questions sur le sujet. Je vous en dirai plus si, comme je l’envisage, j’effectue mon travail de CAS sur ce sujet.
Data Management: Knowledge and skills required in research, scientific and technical organisations – Mary Anne Kennan, School of Information Studies Charles Sturt University, Australia
Qui sont les bibliothécaires participant à la gestion des données dans des organisations, quelles sont leurs compétences, et comment peuvent-ils les acquérir ? Ce travail de recherche a sondé de nombreux professionnels des données dans des institutions de recherche (dont certains bibliothécaires) et tente d’en tirer des conclusions pour permettre d’offrir une meilleure formation dans le domaine.
La première compétence est sociale : le travail du bibliothécaire va inclure une forte interaction avec les producteurs des données et d’autres services. La seconde est de comprendre les technologies de l’information. Il n’est pas nécessaire d’être développeur, mais il faut comprendre les métadonnées, les types de données, et si possible avoir des bases de programmation.
RDM: Exploration and Practices of Academic Libraries – Partnerships, Collaboration, Expertise – (une assistante anonyme représentant) Nie Hua, Peking University Library, China
Pour ceux qui n’ont pas suivi, « RDM » signifie Research Data Management, soit gestion des données de la recherche. Quelques infos en vrac :
- En Chine également, les agences finançant la recherche exigent le dépôt des données sur des archives ouvertes.
- En revanche un sondage auprès des chercheurs montre qu’ils exigent un embargo avant de partager leurs données.
- La bibliothèque de l’Université de Pékin offre une plateforme d’Open Research Data utilisant Dataverse (une solution ouverte – d’autres solutions du même genre citées : DSpace et OpenScholar)
La bibliothèque propose les services suivants :
- curation de données durant tout le processus de recherche,
- tracking des publications liées aux jeux de données,
- formation d’utilisateurs,
- fourniture de statistiques via une mailing-list.
The Geospatial Data Curation, Management, and Discovery in Academic Libraries – Nicole Kong, Purdue University Libraries, United States
L’exploitation des données pour la recherche, c’est bien plus que la simple analyse. Les 5 âges des données, pour un chercheur, ça ressemble à ça :
- Collecte des données brutes
- Nettoyage et consolidation des données
- Analyse
- Publication
Quoi ? J’avais dit 5 ? C’est vrai, mais ils ont tendance à oublier le dernier. Préservation et découverte, bien sûr.
Se contenter d’un dépôt de données n’est pas un apport suffisant des professionnels à la recherche. À Purdue, la bibliothèque intervient déjà très en amont auprès de l’équipe de recherche : dès le départ, des recommandations d’organisation des dossiers et de classement sont proposées par les bibliothécaires pour faciliter le travail dans les étapes suivantes.
Il y avait une dernière présentation intitulée Identifiers and Use Case in Scientific Research. Je n’ai malheureusement pas pris de notes pendant celle-ci, que j’ai eu du mal à suivre, mais vous pouvez bien sûr jeter un oeil à l’article.
À voir également, la présentation donnée par Susan K Reilly dans un autre panel : Europe’s transition to open science.
L’illustration de ce billet, un wordcloud sur les données de la recherche, est l’oeuvre de « Boot strapme » (CC By-SA 2.0)