Sprint #29 d’ISTEX-API: « LI3: Les ingestions plus BRILLantes »

Sprint #29 d’ISTEX-API: « LI3: Les ingestions plus BRILLantes »


Bonjour, Nous venons d’entamer le 29e sprint de l’équipe ISTEX-API. Le but de ce sprint la finalisation du refactoring de loadistex dans sa 3e version (la chaîne d’ingestion de données). Nous en profiterons pour ingérer BRILL au travers de cette nouvelle chaîne. Cette nouvelle chaîne d’ingestion nous permettra de réduire notre dette technique, d’assurer une meilleure robustesse de l’ingestion pour […]

Implémentation des enrichissements refBib Springer et Elsevier (partiellement)

Implémentation des enrichissements refBib Springer et Elsevier (partiellement)


Bonjour, Comme nous vous l’avons signalé dans le billet précédent, nous avons ajouté les références bibliographiques à la liste de nos enrichissements. Ces enrichissements concernent Springer pour 1,4 millions documents et 2,4 millions documents sur Elsevier. Elsevier comportait déjà des références bibliographiques natives sur de nombreuses ressources. pour savoir si un document possède l’enrichissement « refBib », vous pouvez saisir l’identifiant sha1 […]

Nouveau corpus dans l’API : Oxford University Press (OUP)

Nouveau corpus dans l’API : Oxford University Press (OUP)


Bonjour à toutes et à tous,   L’API accueille aujourd’hui le corpus Oxford University Press (OUP). Cette première ingestion propose 1 444 219 objets documentaires supplémentaires. Les fichiers originaux de l’éditeur sont aux formats XML et PDF, et l’on retrouvera également les formats complémentaires TEI, MODS, ZIP et TXT.   Pour retrouver l’ensemble des documents disponibles, rendez-vous sur l’API : https://api.istex.fr/document/?q=*%20AND%20corpusName:oup&output=*   […]