Etat de l’art en matière de crowdsourcing dans les bibliothèques numériques

La BnF (Bibliothèque nationale de France) vient de publier un document intitulé "État de l’art en matière de crowdsourcing dans les bibliothèques numériques" et qui s'inscrit dans le cadre d'un projet de conception d’une plateforme collaborative de correction et d’enrichissement des documents numérisés.

Il semble utile de rappeler que le terme de crowdsourcing signifie en français : externalisation ouverte ou collaborat.

En effet, après deux décennies de numérisation du patrimoine, il n’existe toujours pas de solution infaillible permettant de passer d’un document numérisé à une version en mode texte. Les systèmes de reconnaissance optique de caractères (OCR) permettent de détecter et transposer un mot à partir d’une image, mais ils laissent encore trop d’imperfections pour parvenir à une réédition du document. Le seul moyen est d’utiliser l’intelligence humaine pour analyser le contexte, les langues, la sémantique.

L’objectif du projet est de concevoir une plateforme de correction collaborative de documents numérisés pour en faire des documents rééditables, accessibles à l’ensemble des utilisateurs et adaptés aux nouveaux usages.

Le projet envisage une approche par crowdsourcing pour permettre la correction et l’enrichissement collaboratifs des documents et va s’appuyer sur les réseaux sociaux pour organiser cette collaboration.

Pour rappel, lorsque la BnF a fait le choix de la numérisation de masse, l’augmentation des volumes dans Gallica a entraîné des changements techniques mais a également eu des répercussions sur les relations avec les utilisateurs. C’est pourquoi l’intégration de fonctionnalités participatives au sein d’une bibliothèque numérique doit être pensée en termes d’usages et de fonctionnalités mais également en termes documentaires.

Pour consulter ce document (au format PDF - 1,5 Mo) : www.bnf.fr/documents/crowdsourcing_rapport.pdf

Fabrice MOLINARO