C'est à l'occasion du deuxième hackathon BnF que l'institution a lancé, le 23 novembre dernier, le portail "BnF API et jeux de données".

Cet espace numérique décrit et documente l'ensemble des API (Application Programming Interface, interface de programmation applicative) qui permettent  d'interroger et de récupérer les métadonnées des catalogues et les collections numérisées de la BnF. Pour faciliter l'accès aux données et leur utilisation, des jeux de données (images et textes, métadonnées, statistiques) ont également été constitués et sont directement téléchargeables via le portail. Chaque API ou jeu de données y donne lieu à une présentation du contenu, une documentation technique, des précisions sur les droits d’utilisation et un accès direct aux données.

Sur ce portail, il est notamment possible de trouver les éléments suivants :

  • L’API d’affichage et de récupération des images de Gallica (IIIF), les API d’interrogation des métadonnées de Gallica et de BnF Catalogue général (SRU, Z39.50, OAI) et le sparql endpoint de data.bnf.fr ;
  • Des jeux de données qui constituent des extractions d’ensembles cohérents des catalogues (produits bibliographiques, dumps de data.bnf.fr) ;
  • Des corpus documentaires réalisés dans le cadre de projets de recherche, par exemple les fichiers images et textes constitués dans le cadre du projet Europeana Newspapers ;
  • Des pages éditoriales (qui s’étofferont au fur et à mesure de l’avancée du projet) destinées à guider les utilisateurs dans la découverte et le choix des modes de récupération des données qui conviennent à leurs besoins.

Les responsables du projet appellent notamment les développeurs à puiser dans ce nouveau portail de ressources : "Développeurs et développeuses, chercheurs et chercheuses, acteurs et actrices du mode de la culture et de la chaîne du livre, digital humanists, ou encore amateurs et amatrices de culture,  les données et métadonnées diffusées par la BnF n'attendent plus que vous !"

Plus d'infos : http://api.bnf.fr/