2 septembre 2015 | Team ISTEX | API , Editeurs & Corpus , Ingestion

Nouveau corpus dans l’API : Oxford University Press (OUP)


Bonjour à toutes et à tous,

 

L’API accueille aujourd’hui le corpus Oxford University Press (OUP). Cette première ingestion propose 1 444 219 objets documentaires supplémentaires. Les fichiers originaux de l’éditeur sont aux formats XML et PDF, et l’on retrouvera également les formats complémentaires TEI, MODS, ZIP et TXT.

 

Pour retrouver l’ensemble des documents disponibles, rendez-vous sur l’API :

https://api.istex.fr/document/?q=*%20AND%20corpusName:oup&output=*

 

Pour toute remarque ou suggestion, n’hésitez pas à nous laisser un commentaire !


2 thoughts on “Nouveau corpus dans l’API : Oxford University Press (OUP)

    • Avatar

      Bonjour,

      Le corpus OUP semble avoir, en plus de ses 1 million 400 milles documents,
      quelques qualités supplémentaires,
      comme des métadonnées host.volume, host.issue, host.pages.first et .last,
      ainsi qu’un qualityIndicators.pdfPageCount (pdfPageSize).

      Est-ce due à une meilleur qualité des données fournies par l’éditeur,
      ou à une avant garde d’une amélioration de l’ensemble des corpus ?

      Cordialement

      • Avatar

        Bonjour,

        En effet, il s’agit d’une avant-garde d’une amélioration de l’ensemble des corpus. Nous avons profité de l’été pour recharger les différents corpus déjà ingérés, et allons bientôt mettre en ligne les changements, ainsi qu’un billet de blog expliquant de quoi il en retourne.

        Cordialement

Comments are closed.