Quelques notes en quasi-direct du SRDD auquel je viens d’assister. Après des généralités d’usage et une présentation du projet DLCM qui touche à sa fin, j’ai pu apprendre quelques informations intéressantes.
On attend la fin du mois pour savoir si le financement nécessaire au lancement du dépôt de données DLCM est accordé (pas de lien, les infos en ligne sont obsolètes) . Le back-end est prêt, le front-end doit être développé au cours des prochains mois pour une disponibilité en 2019… si le financement est assuré. Outre les points attendus (FAIR, DOI, 7 copies stockées en Suisse, etc.), l’info du jour était que l’option gratuite inclura 20GB de stockage (pas de limite théorique si on est prêt à payer) et une conservation d’au moins 10 ans.
Le gros morceau pour moi, c’était EnhanceR. Ce projet réunissant des spécialistes de plusieurs universités suisses offre un soutien « Research IT » aux chercheurs en complément des services internes de leurs institutions. Conseil, formation, benchmarking, soutien actif jusqu’à 25 jours par projet, ça paraît répondre à un besoin plusieurs fois ressenti dans une petite institution comme la mienne. Financement à discuter mais pour les grosses interventions, possibilité probable d’utiliser les fonds FNS/ERC d’un projet si nécessaire.
Un autre truc sympa, cet outil de création de DMP développé par Fabio Lehmann et al. du Swiss Institute of Bioinformatics, qui permet à des chercheurs de créer un DMP FNS-compatible standard en cochant quelques cases. Il n’est pas adapté aux sciences sociales pour l’instant, et un développement ultérieur n’est pas prévu faute de financement, mais il est en open-source sur GitHub et l’adapter serait un projet très intéressant. Je vais voir ce que je peux faire mais si vous envisagez de vous y coller, tenez-moi au courant 😉
Toujours à la poster session, on a aussi discuté de dé-identification de documents médicaux (remplacement des noms, lieux et dates) plutôt qu’anonymisation, partant du principe qu’il est quasiment impossible de rendre anonyme un document s’il doit rester utile. L’outil utilisé identifie les éléments d’identification et les remplace. Ca fonctionne avec des documents médicaux relativement formalisés, mais il est apparemment difficile de l’appliquer pour l’instant à des données anthropologiques, dont la forme est trop variable.
On a encore pu voir quelques trucs intéressants l’après-midi, mais trop techniques ou trop généraux pour que j’en parle ici. Une mention quand même à la présentation sur l’interconnection d’éléments de datasets sur Zenodo, qui exploite son API pour ajouter des références croisées aux fichiers dans les métadonnées. Au-delà de mes compétences mais quand même théoriquement intéressant.
Les présentations de Marjan Groovfeld (But can I trust your data?) et Donat Agosti (From liberating emprisoned data in publications to publishing linked open data, liée au paragraphe précédent) étaient aussi intéressantes, mais faute de notes il va me falloir les supports Powerpoint pour en tirer quelque chose de pertinent à dire.
Bref, une bonne journée, à renouveler.
Illustration: ETHZ, sur Wikipedia