Sprint #31 d’ISTEX-API: « ~$> li-refbib »

Sprint #31 d’ISTEX-API: « ~$> li-refbib »


Bonjour, Nous entamons aujourd’hui le Sprint #31 dont le thème principal est la création d’un module d’enrichissement au sein de la chaîne d’ingestion de données d’ISTEX. Ce module permettra d’intégrer les références bibliographiques extraites du plein-texte, dans la TEI, durant l’ingestion. Actuellement l’extraction de refbib se fait en aval de la chaîne, et leur intégration dans la TEI se fait […]

Et de dix ! (De Gruyter Journals)

Et de dix ! (De Gruyter Journals)


Chers utilisatrices et utilisateurs, C’est avec grand plaisir que nous vous annonçons la disponibilité d’un 10ème corpus : DeGruyter Journals. Ce corpus comprend 242242 articles de revues, majoritairement en langue anglaise et allemande. Vous pouvez dès à présent y accéder via l’API, le démonstrateur ou les widgets en sélectionnant le corpus nommé « degruyter-journals ». L’API compte désormais plus de 16 millions […]

Sprint #30 d’ISTEX-API: Open Concerto

Sprint #30 d’ISTEX-API: Open Concerto


Bonjour, Nous commençons un nouveau sprint dès lundi (Sprint #30), nommé « Open Concerto » (rien à voir avec l’ERP opensource du même nom :). Pourquoi « Open Concerto » ? Car ce sprint portera sur une réflexion quant aux OpenURL et un état de l’art les concernant, ainsi que sur la création d’un MVP (Minimum Valuable Product) afin d’administrer le déroulement d’une ingestion […]

Sprint #29 d’ISTEX-API: « LI3: Les ingestions plus BRILLantes »

Sprint #29 d’ISTEX-API: « LI3: Les ingestions plus BRILLantes »


Bonjour, Nous venons d’entamer le 29e sprint de l’équipe ISTEX-API. Le but de ce sprint la finalisation du refactoring de loadistex dans sa 3e version (la chaîne d’ingestion de données). Nous en profiterons pour ingérer BRILL au travers de cette nouvelle chaîne. Cette nouvelle chaîne d’ingestion nous permettra de réduire notre dette technique, d’assurer une meilleure robustesse de l’ingestion pour […]

Implémentation des enrichissements refBib Springer et Elsevier (partiellement)

Implémentation des enrichissements refBib Springer et Elsevier (partiellement)


Bonjour, Comme nous vous l’avons signalé dans le billet précédent, nous avons ajouté les références bibliographiques à la liste de nos enrichissements. Ces enrichissements concernent Springer pour 1,4 millions documents et 2,4 millions documents sur Elsevier. Elsevier comportait déjà des références bibliographiques natives sur de nombreuses ressources. pour savoir si un document possède l’enrichissement « refBib », vous pouvez saisir l’identifiant sha1 […]

Nouveau corpus dans l’API : Oxford University Press (OUP)

Nouveau corpus dans l’API : Oxford University Press (OUP)


Bonjour à toutes et à tous,   L’API accueille aujourd’hui le corpus Oxford University Press (OUP). Cette première ingestion propose 1 444 219 objets documentaires supplémentaires. Les fichiers originaux de l’éditeur sont aux formats XML et PDF, et l’on retrouvera également les formats complémentaires TEI, MODS, ZIP et TXT.   Pour retrouver l’ensemble des documents disponibles, rendez-vous sur l’API : https://api.istex.fr/document/?q=*%20AND%20corpusName:oup&output=*   […]