#WLIC2016 – Collections à l’ère numérique : le meilleur des mondes ?

Brave New World ‐ the Future of Collections in Digital Times: Services without Content OR Content in Context?

Ce premier billet dédié au contenu des panels du congrès WLIC aborde le problème des collections, et plus spécifiquement des collections numériques (on ne se refait pas). Les intervenants de cette première session ont insisté à la fois sur notre rôle de diffusion et de conservation, en fonction des priorités de leurs institutions.

Conserver : le Hathi Trust

Digitization and Aggregation – Mike Furlough, Hathi Trust, United States

L’objectif premier du Hathi Trust est la conservation, mais son projet permet évidemment bien plus. L’effort de numérisation n’est pas forcément visible, car seulement 40% des documents sont accessibles – le reste est sous copyright.

L’organisation surtout de grandes institutions. Le réseau sert ici à augmenter l’efficacité de la numérisation, en évitant par exemple les numérisations à double, et surtout un énorme travail d’inventaire : qui possède quoi ? Chaque document numérisé doit rester disponible sous forme papier dans au moins un site du réseau.

Les données sont reproduites et conservées dans plusieurs lieux, et ensuite seulement distribuées. Ce n’est qu’un début : après tout, c’est seulement en 2004 que Google a lancé ses projets de numérisation. OCLC estime que 35 millions de documents uniques existent dans les collections des bibliothèques universitaires et de recherche. Ça prendra du temps.

Contrairement à ce qu’on pourrait croire, c’est un projet international : seulement 50% des contenus sont en langue anglaise. Si l’OCR est (soi-disant) performant pour les alphabets latins, les documents utilisant d’autres écritures posent toutefois des problèmes de taille.

Diffuser : l’exemple de la DPLA

Collaboration at Scale: How the Digital Public Library of America Unites Collections and Maximizes Use – Dan Cohen, Digital Public Library of America (DPLA), United States

La Digital Public Library of America réunit également les efforts de multiples bibliothèques pour rendre les collections accessibles au plus grand nombre. Pour Dan Cohen, l’open access est vu comme un moyen, pas une fin. Ne pas demander d’inscription aux utilisateurs fait partie de cette vision. Proposer une API ouverte permettant le développement d’applications ouvrant des accès originaux aux collections également. Et enfin, un objectif de la même veine est de simplifier les droits d’utilisation des documents.

C’est un projet décentralisé, qui réunit 14 millions de documents provenant de 2000 institutions selon un modèle de pôles mis en réseau. Les plus gros « pôles de contenu » (content hubs) sont autonomes. Les « pôles de service » (service hubs) offrent eux un soutien technique et des compétences aux plus petits membres du réseau dans leurs efforts de numérisation et de mise en ligne. Les bibliothèques universitaires comme publiques peuvent ainsi y contribuer plus facilement (les apports sont équilibrés entre ces 2 catégories).

A noter également : des éditeurs majeurs (Hachette, Bloomsbury, Macmillan…) font don de livres numériques à cette organisation. Selon Dan Cohen, même les familles pauvres disposent du matériel nécessaire pour obtenir des documents précédemment inaccessibles. De plus, des « sets » de sources primaires ont été créés à des fins éducatives : les enseignants peuvent s’y fier et les transmettre à leurs élèves.

Libérez ! Délivrez !

Open-Access-Publishing and Repositories – Kathleen Shearer, Confederation of Open Access Repositories (COAR), Canada (slides présentées par Martha Whitehead)

Aujourd’hui, le principe de l’Open Access n’est plus vraiment disputé : c’est une réalité. En revanche, il existe des tensions quant à la méthode appropriée. Trois modèles se détachent pour l’avenir de l’Open Access : le passage des revues à un modèle OA, leur remplacement par des coopératives d’édition, et enfin les dépôts numériques institutionnels de nouvelle (future) génération.

The Flip

Le premier modèle a pour lui qu’il serait rapide à mettre en place, et que les éditeurs majeurs ne seraient pas menacés. Des négociations de ce type existent déjà. En revanche, il ne réduirait pas les coûts du système et renforcerait les monopoles actuels, laissant les institutions académiques vulnérables.

La coop

Le deuxième modèle permettrait à de petits éditeurs de faire leur transition tout en leur offrant une forme de stabilité, et ne serait pas mené dans des buts lucratifs. Mais obtenir la collaboration des différentes parties sera difficile, et plus le délai est long, moins le résultat aura des chances de succès.

Star repository : the next generation

Le dernier modèle a pour lui de donner le contrôle de la communication scientifique aux institutions académiques elles-mêmes. Ceci mettrait fin au conflit entre partage des connaissances et nécessités financières, et pourrait s’appuyer sur un réseau déjà important de dépôts open access actuels.
En revanche, ceci nécessite le développement massif de fonctionnalités dont aucun dépôt ne dispose encore. De plus, un système aussi distribué et décentralisé risque d’être lent à innover et risque d’évoluer de manière peu coordonnée. Mais le plus difficile risque d’être de convaincre la communauté des chercheurs.

#OnVaTousMourir

The Collection and Archiving of Born Digital Content – James Neal, Columbia University, United States

« We are in serious trouble. » Le président-élu de l’ALA sait soigner ses introductions. Dans quelques années, quand nos usagers voudront consulter les collections de nos premiers documents nativement numériques, ils seront probablement « really angry. » Le nombre et les types de contenus paraissent absolument ingérables, et c’est à nous de faire face à cette mission impossible. L’histoire en dépend – littéralement.

Provocatrice et si compacte qu’elle est impossible à résumer, son intervention est de celles qui font réfléchir. Des listes de questions à régler, des points de controverse, des questions qui font peur, des formules-choc (Repository chaos, un bon nom de groupe pour des rockers académiques), bref, des combats impossibles à mener sur de multiples fronts… Nous vivons des temps intéressants.

Une seule issue : établir « agressivement » des collaborations à des niveaux encore inconnus entre les institutions de l’ensemble du milieu GLAM. Facile.

Il y en a un peu plus, je vous le laisse ?

Les interventions ci-dessous n’étaient pas dénuées d’intérêt, mais mes notes étaient trop parcellaires pour vous en parler en détail. Je vous laisse donc consulter les diapos si elles vous intéressent particulièrement.

Contextualizing and Decontextualizing: Adding Value to Collections in Digital Ecosystems – Klaus Ceynowa, Bavarian State Library, Germany

Cette présentation portait principalement sur la numérisation des collections de la Bibliothèque de l’Etat de Bavière et sur leur exploitation enrichie, notamment via l’utilisation du framework IIIF. Ce travail porte à la fois sur les manuscrits et sur les images (illustrations, cartes, etc.) Des outils de reconnaissance visuelle permettent de chercher dans le contenu lui-même, et par similarité graphique.

Un travail particulier a été effectué sur les cartes historiques de Bavière. On peut les utiliser à la manière de Google Maps, avec une géolocalisation en temps réel et des liens et illustrations présentant le patrimoine bâti présent et disparu.

À voir sur Youtube: application de la bibliothèque de l’Etat de Bavière (1 min. 21).

Cooperative Collection Development in a Digital Age – Jeff Carroll, Columbia University, United States

Les universités Cornell (Ithaca, NY) et Columbia (NY, NY) ont formé un consortium pour la gestion de leurs collections. Le besoin de collaboration n’est pas nouveau : l’espace nécessaire à l’hébergement des collections faisait déjà défaut dans les années 30, malgré les extensions successives.

A notre époque, la publication scientifique explose, et les budgets… Un peu moins. Réduire les dépenses tout en élargissant l’accès en éliminant les redondances est aujourd’hui obligatoire. Bref, une étude de cas sans élément révolutionnaire.

À lire également, le billet de blog d’American Libraries sur ce panel : The future is digital.

Notons que sur 6 intervenants, 5 étaient des hommes, dans un métier qui compte plus de deux tiers de femmes.

Info IFLA pour conclure: Peu après le #WLIC2016, Die Zeit a publié un article (en allemand) sur l’immense écart entre les collections numériques disponibles dans les pays occidentaux et celles des pays du Sud. « Die leeren Seiten der Weltbibliothek : Wer schließt die Kluft des Wissens zwischen Arm und Reich? » (Eva Bucher, Die Zeit, Nr. 36/2016, 08.09.2016)
Parmi les projets visant à compenser cet état de fait, notons la Bibliothèque numérique mondiale lancée par la Library of Congress avec le soutien de l’UNESCO.

Illustration de couverture: Neuester Plan von München, [1888] (Bibliothèque d’État de Bavière)