Documentation sur la constitution de corpus thématiques

Documentation sur la constitution de corpus thématiques


Pour démarrer cette nouvelle année, l’équipe ISTEX-CORPUS met en ligne une documentation destinée à répondre aux questions des utilisateurs d’ISTEX désireux de constituer un corpus de textes intégraux à partir de l’API, en vue d’une utilisation éventuelle en traitement automatique du langage (TAL) ou en fouille de textes et de données (TDM). Cette documentation présente des conseils et des astuces […]

Mise à jour du corpus Springer

Mise à jour du corpus Springer


Chers utilisateurs et utilisatrices, C’est avec un grand plaisir que nous vous annonçons la mise à jour du corpus Springer. Comme indiqué lors du précédent billet de blog, les documents de l’éditeur Springer sont à présent disponibles sous deux noms de corpus : springer-journals : pour tous les documents de type « article » springer-ebooks : pour tous les documents de type […]

Enrichissements auteurs et sujets

Enrichissements auteurs et sujets


Les enrichissements auteurs et sujets fournis par l’ABES ont été récemment chargés dans la plateforme ISTEX et certains champs tels que ‘enrichments.hubMeta.mimetype’ et ‘enrichments.hubMeta.original’ ont été rajoutés dans l’index.Le champ enrichments.type et notamment le type abesAuthors ou abesSubjects permet également d’effectuer une recherche et une facette sur ce type d’enrichissement. Suite à ce nouvel enrichissement, nous souhaitons donc apporter quelques […]

Fin du Sprint 37 d’ISTEX-API: « Fed-Ex, après la préparation, la livraison »

Fin du Sprint 37 d’ISTEX-API: « Fed-Ex, après la préparation, la livraison »


Bonjour,   Nous avons terminé le sprint #37 « Fed-Ex, après la préparation, la livraison » ce mardi. Voici le Burndown chart et le Reste-à-faire : Les premiers congés estivaux au sein de l’équipe se font sentir, néanmoins, nous avons tout de même été en capacité d’effectuer un certains nombre de réalisation : Passage de l’API v3.9 Bugfix sur l’authentification par IP, […]

Export de sous-corpus, disponible en intégration

Export de sous-corpus, disponible en intégration


Bonjour, Une nouvelle fonctionnalité vient de faire son apparition sur l’API : l’extraction (ou export) de sous-corpus. Celle-ci est disponible sur la version d’intégration (api-integ.istex.fr). Grâce à cette fonctionnalité, vous serez en capacité de demander à l’API de vous fournir une archive ZIP contenant les fichiers relatifs aux documents correspondants à votre recherche. Pour ceux et celles d’entre vous qui […]

Exposition du Score & Ranking

Exposition du Score & Ranking


Bonjour, Comme vous nous l’avions promis lors du séminaire technique (et désolé du retard), nous venons d’exposer le score en intégration. Ceci est une news rapide, nous rentrerons dans les détails ultérieurement. Pourquoi en intégration ? Car nous sommes face à quelques dilemmes conceptuels et nous aimerions que vous nous disiez ce qui est le plus instinctif pour vous, nos […]

Fin d’ « APIculture » (ISTEX-API S#35)

Fin d’ « APIculture » (ISTEX-API S#35)


Bonjour, le sprint 35: “APIculture” s’est terminé jeudi 12 mai 2016. Au cours de ce sprint nous avons rempli un certain nombre d’objectifs que nous nous étions fixés. Environ 80% des points de complexité ont été résolus malgré la longueur du sprint (du 25/03/2016 au 12/05/2016), et que les sprints longs sont lassants sur la fin (et légèrement anti-AGILE). Voici […]

Fin de l’OdeISTEX (S#34) de l’équipe ISTEX-API

Fin de l’OdeISTEX (S#34) de l’équipe ISTEX-API


Bonjour, Nous n’avons pas eu le temps de faire le billet de blog correspondant à la fin du sprint #34: L’odeISTEX. Le voici. L’odeISTEX s’est terminé jeudi dernier, en voici le reste à faire et le burndown chart : Le reste à faire portait essentiellement sur la fin de l’ingestion d’RSC ebook que nous n’avons pas pu mener à bien […]

API v3.6.0

API v3.6.0


Bonjour, Nous allons prochainement procéder à la mise en place de la nouvelle version de l’API. Cette version ne comporte malheureusement pas de nouveauté vraiment visible en dehors de la facette de type histogramme sur les champs de type « nombre »‘. La documentation a été mise à jour en conséquence. Cette version apporte également quelques bugfixes, comme par exemple une erreur […]

Sprint #34 d’ISTEX-API: « L’ode ISTEX »

Sprint #34 d’ISTEX-API: « L’ode ISTEX »


Bonjour, L’équipe ISTEX-API entame le Sprint #34: « L’ode ISTEX ». Il a commencé vendredi 26 février avec sa planification et se terminera le 24 mars 2016 avec sa revue. Voici la répartition de la charge de travail par User Story, en fonction des points de complexité attribués aux tâches qui les composent : L’expedite est composé des charges qui […]