Version 5 de l’API : déroulement des opérations

Version 5 de l’API : déroulement des opérations


Chers utilisateurs et utilisatrices, Nous vous avons annoncé dans un précédent billet la publication prochaine de la version 5 de l’API. Ce billet a pour but de préciser le déroulement des opérations et le calendrier de mise en œuvre. Pour vous laisser le temps d’adapter vos scripts et interfaçages de l’API, nous avons décidé de faire cohabiter les versions 4 […]

À venir dans la version 5 de l’API

À venir dans la version 5 de l’API


Chers utilisateurs et utilisatrices, Depuis plusieurs semaines, nous avons entamé un processus de mise à jour de notre moteur de recherche Elasticsearch, de la version 1.7 à la version 5.3. Cette mise à jour étant un grand saut (nous avons « sauté » la version 2.x du logiciel), elle apporte un grand nombre de nouveautés et de changements. Un gain en performance […]

Océrisation du corpus Nature

Océrisation du corpus Nature


  L’équipe ISTEX-DATA a le plaisir de vous annoncer l’océrisation de 329 744 documents pour le corpus Nature, soit l’équivalent de plus de 600 000 pages. Cette océrisation concerne les PDF dépourvu de texte et permet de proposer des fichiers TXT (fulltext/ocr) pour tout le corpus Nature disponibles dans le démonstrateur avec l’icône suivante : D’autres corpus seront océrisés dans […]

L’OpenURL passe la seconde…

L’OpenURL passe la seconde…


Chèr(es) utilisatrices et utilisateurs, Nous venons de franchir une étape importante aujourd’hui en mettant en production une nouvelle version de l’API, numérotée 4.1.0. Celle-ci apporte un gain important en rapidité au niveau du résolveur OpenURL, grâce à la mise en cache côté API du lien DOI vers identifiant ISTEX. Ce cache interne gère également le lien à partir des identifiants […]

Enrichissements auteurs et sujets

Enrichissements auteurs et sujets


Les enrichissements auteurs et sujets fournis par l’ABES ont été récemment chargés dans la plateforme ISTEX et certains champs tels que ‘enrichments.hubMeta.mimetype’ et ‘enrichments.hubMeta.original’ ont été rajoutés dans l’index.Le champ enrichments.type et notamment le type abesAuthors ou abesSubjects permet également d’effectuer une recherche et une facette sur ce type d’enrichissement. Suite à ce nouvel enrichissement, nous souhaitons donc apporter quelques […]

Les enrichissements disponibles

Les enrichissements disponibles


Parmi les enrichissements produits par l’équipe ISTEX-RD, voici ceux qui sont actuellement disponibles sur l’API d‘ISTEX : • les références bibliographiques structurées par Grobid (actuellement plus de 9 millions de documents) Les références bibliographiques données par les éditeurs sont extraites et structurées par le logiciel Grobid (GeneRation Of BIbliographic Data) qui est un outil d’analyse et d’extraction d’informations bibliographgiques et […]

Informations sur la nouvelle version de l’API

Informations sur la nouvelle version de l’API


Bonjour, Comme nous vous l’avons indiqué la semaine dernière, la version de l’API 4.0.2 est en ligne. Cette mise à jour entraîne quelques comportements de transition, que nous souhaitons vous communiquer : Vous pouvez apercevoir la présence d’enrichissements de type refBib au lieu de refBibs pour certains corpus, Vous pouvez voir également des catégories WOS et Science-Metrix en majuscules et […]

Chaîne OCR

Chaîne OCR


Après plusieurs mois d’étude sur l’évaluation des logiciels OCR, les techniques d’estimation de qualité OCR puis les tests de mise en production, l’équipe ISTEX-DATA a conçu sa propre chaîne OCR en développant des modules qui se sont intégrés à la chaîne LoadISTEX existante. Cette chaîne OCR va permettre d’océriser dans un premier temps les PDF ‘image’ (absence de texte) et […]

Nouvelle version de l’API en approche

Nouvelle version de l’API en approche


Chères utilisatrices et utilisateurs, Je profite de ce premier billet de l’année pour vous présenter, au nom des 3 équipes ISTEX, nos meilleurs vœux pour l’année 2017. Pour notre part, cette année qui débute sera particulière, car elle marquera la fin du projet ISTEX à la fin de l’été, au moins dans sa configuration actuelle. Concernant l’équipe ISTEX-API, l’enjeu de […]

Mise en ligne du corpus « Sage Publications »

Mise en ligne du corpus « Sage Publications »


Chers utilisatrices et utilisateurs, Aujourd’hui, c’est vendredi, et en dépit de la fameuse maxime « on ne met pas en production le vendredi  » , nous venons tout juste de mettre en ligne le corpus « Sage Publications ». Ce corpus de l’éditeur Sage est composé de 748 titres de revues scientifiques publiées depuis les origines jusqu’en 2009. Pour plus d’informations sur ce […]