API ISTEX en mode dégradé

API ISTEX en mode dégradé


Bonjour à toutes et à tous, Si vous nous avez suivi sur twitter (#istexdev) ou sur la liste de discussion (api-users@listes.istex.fr), vous avez constaté que l’API subit de fortes perturbations depuis le début de la semaine (coupure totale ou accès partiel). La situation n’étant toujours pas totalement rétablie, nous souhaitions faire un point sur la situation. D’un point de vue […]

Entraînement du modèle fulltext de Grobid par l’équipe R&D

Entraînement du modèle fulltext de Grobid par l’équipe R&D


Cet article est la suite de l’article « Entraînement du modèle segmentation de Grobid par l’équipe R&D ». pour retrouver les informations utiles à une bonne compréhension du présent article, il est conseillé de se référer au lien suivant :  https://blog.istex.fr//entrainement-du-…id-par-equipe-rd/ . Modèle fulltext de Grobid Le modèle fulltext s’applique sur le segment body identifié par le modèle segmentation, c’est-à-dire sur le corps de texte. […]

Entraînement du modèle segmentation de Grobid par l’équipe R&D

Entraînement du modèle segmentation de Grobid par l’équipe R&D


ISTEX et plein texte structuré À l’heure de rédaction de ce billet de blog, la plateforme ISTEX met à disposition plus de 18 millions de documents scientifiques au format PDF à l’ensemble de la communauté de l’Enseignement Supérieur et de la Recherche. Au delà d’un accès performant et pérenne aux documents PDF, la disponibilité de documents pleins textes structurés en […]

Version 5 de l’API : déroulement des opérations

Version 5 de l’API : déroulement des opérations


Chers utilisateurs et utilisatrices, Nous vous avons annoncé dans un précédent billet la publication prochaine de la version 5 de l’API. Ce billet a pour but de préciser le déroulement des opérations et le calendrier de mise en œuvre. Pour vous laisser le temps d’adapter vos scripts et interfaçages de l’API, nous avons décidé de faire cohabiter les versions 4 […]

À venir dans la version 5 de l’API

À venir dans la version 5 de l’API


Chers utilisateurs et utilisatrices, Depuis plusieurs semaines, nous avons entamé un processus de mise à jour de notre moteur de recherche Elasticsearch, de la version 1.7 à la version 5.3. Cette mise à jour étant un grand saut (nous avons « sauté » la version 2.x du logiciel), elle apporte un grand nombre de nouveautés et de changements. Un gain en performance […]

Océrisation du corpus Nature

Océrisation du corpus Nature


  L’équipe ISTEX-DATA a le plaisir de vous annoncer l’océrisation de 329 744 documents pour le corpus Nature, soit l’équivalent de plus de 600 000 pages. Cette océrisation concerne les PDF dépourvu de texte et permet de proposer des fichiers TXT (fulltext/ocr) pour tout le corpus Nature disponibles dans le démonstrateur avec l’icône suivante : D’autres corpus seront océrisés dans […]

L’OpenURL passe la seconde…

L’OpenURL passe la seconde…


Chèr(es) utilisatrices et utilisateurs, Nous venons de franchir une étape importante aujourd’hui en mettant en production une nouvelle version de l’API, numérotée 4.1.0. Celle-ci apporte un gain important en rapidité au niveau du résolveur OpenURL, grâce à la mise en cache côté API du lien DOI vers identifiant ISTEX. Ce cache interne gère également le lien à partir des identifiants […]

Enrichissements auteurs et sujets

Enrichissements auteurs et sujets


Les enrichissements auteurs et sujets fournis par l’ABES ont été récemment chargés dans la plateforme ISTEX et certains champs tels que ‘enrichments.hubMeta.mimetype’ et ‘enrichments.hubMeta.original’ ont été rajoutés dans l’index.Le champ enrichments.type et notamment le type abesAuthors ou abesSubjects permet également d’effectuer une recherche et une facette sur ce type d’enrichissement. Suite à ce nouvel enrichissement, nous souhaitons donc apporter quelques […]

Les enrichissements disponibles

Les enrichissements disponibles


Parmi les enrichissements produits par l’équipe ISTEX-RD, voici ceux qui sont actuellement disponibles sur l’API d‘ISTEX : • les références bibliographiques structurées par Grobid (actuellement plus de 9 millions de documents) Les références bibliographiques données par les éditeurs sont extraites et structurées par le logiciel Grobid (GeneRation Of BIbliographic Data) qui est un outil d’analyse et d’extraction d’informations bibliographgiques et […]

Informations sur la nouvelle version de l’API

Informations sur la nouvelle version de l’API


Bonjour, Comme nous vous l’avons indiqué la semaine dernière, la version de l’API 4.0.2 est en ligne. Cette mise à jour entraîne quelques comportements de transition, que nous souhaitons vous communiquer : Vous pouvez apercevoir la présence d’enrichissements de type refBib au lieu de refBibs pour certains corpus, Vous pouvez voir également des catégories WOS et Science-Metrix en majuscules et […]