Pour les bibliothécaires, l’une des grandes qualités de l’e-book par rapport au livre papier est qu’il est possible de connaître en détail l’utilisation de chaque titre. Pour l’imprimé, les statistiques d’usage se restreignent en général au prêt. Pour le numérique, toute consultation, même « sur place », est comptabilisée. Pas de doute sur l’utilisation ou pas d’une ressource à laquelle on est abonné, ni sur le besoin d’acquérir des licences supplémentaires.
Oui, mais idéalement, il faudrait des statistiques fiables et comparables pour déterminer l’usage relatif de ressources dont les prix sont très variés. C’est ce que promet l’organisation à but non-lucratif « Project Counter », qui propose un code de conduite fixant les méthodes d’analyse et de comptage d’accès que les fournisseurs offriront à leurs clients à travers des rapports normalisés.
Cool, c’est gagné, passons à la suite ! (spoiler: pas si simple)
Oh, sweet summer child
Les rapports Counter4 se divisent en plusieurs catégories. Oui, Counter4, parce que c’est déjà la quatrième génération de ces rapports, et qu’une cinquième devrait voir le jour prochainement. Mais ça importe finalement assez peu : tant que tous les fournisseurs utilisent la même version des spécifications, ils devraient proposer des chiffres comparables (vous aurez noté le conditionnel en emphase).
Ces catégories sont Book report (BR), Journal report (JR), Database report (DR), et Platform report (PR). Je ne parlerai ici que de l’aspect e-books, qui est celui que je maîtrise. Les modèles de rapports des périodiques et bases de données sont différents, et je ne sais pas s’ils ont les mêmes problèmes (spoiler: probablement). Le modèle « plateforme » est sans intérêt pour mon usage.
Les book reports ont une numérotation fixée par Counter4, avec des définitions qui paraissent à première vue assez claires. Sauf qu’en fait, non. Quelques exemples avec deux fournisseurs avec lesquels nous travaillons : Proquest, sur sa plateforme EbookCentral, et Brill. Le premier fournit des e-books de multiples éditeurs avec différents types de licences que je n’évoquerai pas en détail ici. Le second est un éditeur important dans le domaine du droit international (Martinus Nijhoff et autres « marques » lui appartiennent) et sa plateforme ne propose donc que ses propres titres.
BR1 : Title requests
Ce rapport dénombre les accès à un titre (livre) spécifique pendant la période sélectionnée (généralement un mois, mais l’utilisateur peut demander des périodes spécifiques si ça l’intéresse). Et quand on compare les chiffres d’EbookCentral à ceux de la plateforme Brill, on constate que sur EBC, très peu de titres sont consultés. Mais genre, très, très peu, si on se fie au rapport Counter4. J’entends par là qu’alors que nous avons une collection de 1500 titres, le nombre indiqué par BR1 est inférieur à 10 pour la majorité des mois. Alors que Brill, dont nous avons acquis moins de 300 titres, nous annonce des résultats supérieurs. How weird.
La raison est simple : ce rapport compte plus spécifiquement le nombre de téléchargements/accès à un titre entier. Ce qui signifie que si votre plateforme ne propose que la diffusion par chapitres, ce nombre sera de… zéro. Dans notre cas, comme la majorité des ouvrages sont en licence single user sur EbookCentral, ils ne sont pas téléchargeables et doivent être consultés en ligne. Seuls la centaine de titres disponible en multi-user peuvent générer ce type de téléchargement, ce qui explique des chiffres ridicules.
BR1 n’est donc pas pertinent. Qu’à cela ne tienne, il y a un autre rapport qui répondra à nos interrogations.
BR2 : Section requests
Le nombre d’accès au premier niveau de subdivision d’un livre pendant la période sélectionnée. Logiquement, chaque téléchargement ou accès à un chapitre devrait être décompté. Et là, surprise : la plateforme ProQuest détruit, atomise, éparpille façon puzzle celle de Brill. Au point où les chiffres paraissent à nouveau suspects, mais dans le sens inverse.
J’avais dit « accès à un chapitre » ? Non. Accès au premier niveau de subdivision déterminé par le fournisseur. En fonction de la méthode d’accès (streaming, document hypertexte, téléchargement), on ne parle pas de la même chose. Ce serait trop simple. Brill, donc, propose bien des téléchargements par chapitre, et les chiffres annoncés sont donc crédibles. Sur EbookCentral, en revanche, on parle toujours de lecture en streaming, et chaque page de l’e-book est un fichier séparé. On atteint donc des statistiques complètement aberrantes et pas comparables.
BR2 n’est donc pas génial non plus. Qu’à cela ne tienne, Counter prévoit un nouveau rapport qui réglera tous nos problèmes.
BR7 : le plus petit dénominateur commun
Ce nouveau/futur type de rapport, censé être lancé en 2016 (chers fournisseurs, il faudrait vous bouger, parce qu’on est en juin 2017, et je ne l’ai toujours pas vu) compte les accès uniques à chaque titre : que le lecteur en consulte 27 pages, 3 chapitres, ou télécharge le document entier, la valeur du rapport sera incrémentée de 1. L’implémentation du rapport est facultative, mais serait appréciable, parce que les données des différents fournisseurs devraient enfin être comparables sur ce point.
Cela dit, ce chiffre doit être considéré conjointement avec les autres : les statistiques détaillées (non-Counter4) de ProQuest me permettent de constater que certains accès ne génèrent que quelques pages lues (parfois une seule), alors que d’autres sont liés à une forte utilisation. BR7 est donc utile, mais pas suffisant pour estimer l’utilisation réelle d’une collection de livres numériques.
Eh, tu as oublié BR3, 4, 5 et 6 !
BR3 mesure les refus d’accès (pour cause de licence inexistante ou insuffisante. C’est quelque chose de très intéressant pour développer la collection (upgrades de licences, achat de titres manquants), mais pas tellement pour comparer entre collections.
BR4 mesure les refus d’accès par plateforme. Je n’ai pas encore vu des cas où ça m’intéresserait.
Très honnêtement, BR5 ne m’intéresse pas non plus. Il s’agit des recherches effectuées sur la plateforme et à l’intérieur des documents. Comme nous disposons de multiples plateformes proposant des contenus différents, c’est assez peu pertinent : l’outil de recherche privilégié est Explore/Primo, pas chaque outil individuellement.
Quant à BR6… apparemment, il n’existe pas. N’hésitez pas à me signaler si vous avez une info à ce sujet, ça me paraît tout de même un peu étrange (et je veux bien passer pour un imbécile si ça me permet d’apprendre quelque chose).
Et si on comparait quand même ?
Comment comparer ce qui n’est pas comparable ? On peut tenter une technique de conversion « à la louche ». Le résultat ne serait pas très scientifique, mais je pense qu’il serait tout de même intéressant, à défaut d’être fiable. J’aimerais développer quelques formules pour ce faire, mais je n’ai sincèrement pas le temps de m’y consacrer.
A combien de pages lues correspond le téléchargement d’un chapitre ? Combien de pages lues pour le téléchargement d’un livre entier ? Il faudrait d’abord recenser la longueur moyenne des sections « chapitre » chez chaque fournisseur qui les utilise, le nombre de pages lues par accès chez les autres, etc. Si je me décide un jour à y réfléchir sérieusement (2018 au mieux), j’écrirai avec plaisir un 2ème billet sur le sujet.
Et donc, on fait quoi en attendant ?
On compare ce qui est comparable : les titres d’un seul fournisseur entre eux, et l’évolution de l’usage d’une ressource à travers le temps. Et c’est déjà pas mal.
À lire :
Friendly guide to Counter reports : a guide for librarians / Mitchell Dunkley (pdf)
Illustration de couverture : Gravure extraite de Description de la Chine, édition de La Haye 1736. Volume 3. Après la page 354. Suanpan, boulier-compteur chinois. (via Wikipedia)