Exposition du Score & Ranking

Exposition du Score & Ranking


Bonjour, Comme vous nous l’avions promis lors du séminaire technique (et désolé du retard), nous venons d’exposer le score en intégration. Ceci est une news rapide, nous rentrerons dans les détails ultérieurement. Pourquoi en intégration ? Car nous sommes face à quelques dilemmes conceptuels et nous aimerions que vous nous disiez ce qui est le plus instinctif pour vous, nos […]

Sprint 9 ISTEX-DATA : Sélection officielle « Un certain regard documentaire »

Sprint 9 ISTEX-DATA : Sélection officielle « Un certain regard documentaire »


Bonjour,   L’équipe ISTEX-DATA entame le Sprint #9: « Sélection officielle « Un certain regard documentaire ». Il a commencé mardi 17 mai par sa planification et se terminera le 12 juin 2016 par sa revue de sprint. Voici la répartition de la charge de travail par thématique de travail, en fonction des points de complexité attribués par les membres de l’équipe. […]

Sprint 36 d’ISTEX-API: Fed-Ex

Sprint 36 d’ISTEX-API: Fed-Ex


Bonjour, Nous avons débuté notre 36e Sprint vendredi 13 mai. Parmi les nouvelles thématiques : La fédération d’identité et l’export de sous-corpus au format tar.gz (ou zip, à débattre). Concernant l’export, l’implémentation ne se fera probablement pas dans ce sprint. Le Scrumboard (quelques post-it ont déjà quitté le Sprint Backlog): La répartition de la charge de travail : Vous connaissez […]

Fin d’ « APIculture » (ISTEX-API S#35)

Fin d’ « APIculture » (ISTEX-API S#35)


Bonjour, le sprint 35: “APIculture” s’est terminé jeudi 12 mai 2016. Au cours de ce sprint nous avons rempli un certain nombre d’objectifs que nous nous étions fixés. Environ 80% des points de complexité ont été résolus malgré la longueur du sprint (du 25/03/2016 au 12/05/2016), et que les sprints longs sont lassants sur la fin (et légèrement anti-AGILE). Voici […]

Nouvelle version de l’API et mise à jour des corpus

Nouvelle version de l’API et mise à jour des corpus


Chères utilisatrices et utilisateurs, Vous avez peut-être constaté une légère instabilité de l’API ISTEX depuis hier après-midi… nous en sommes désolé, cela était lié à une mise en production un peu difficile. Les soucis ont été résolus aujourd’hui en fin de matinée. En contrepartie, nous venons de mettre à disposition une nouvelle version de l’API, estampillée 3.7.1. Cette version de […]

RSC : après les e-books, les journals !

RSC : après les e-books, les journals !


Chers utilisatrices et utilisateurs,   Après la mise en ligne récente des e-books de l’éditeur RSC, nous venons de mettre à disposition le corpus « journals » de l’éditeur RSC. (petit nom : rsc-journals) Ce corpus contient pour l’instant des articles de revue publiés entre 1841 et 2007. Le nombre d’articles disponibles est de 258 515, ce qui porte le nombre total […]

Évaluer les résultats d’OCR dans le projet ISTEX

Évaluer les résultats d’OCR dans le projet ISTEX


Constat La grande majorité des documents ingérés dans le projet ISTEX proviennent de publications papiers numérisées que les éditeurs ont mises en ligne à partir des années 90. Cela signifie que le contenu textuel disponible est essentiellement le résultat d’une OCRisation. Une OCRisation consiste en la conversion automatique d’une image, résultat de la numérisation d’un document papier, en un fichier […]

Royal Society of Chemistry – Partie e-books

Royal Society of Chemistry – Partie e-books


Chers utilisatrices et utilisateurs, Nous avons mis à disposition notre 14ème corpus à travers l’API, celui concernant la partie e-books de la Royal Society of Chemistry (RSC). Ce corpus comprend 23888 chapitres et autres documents, uniquement en langue anglaise, édités entre 1968 et 2015. Vous pouvez dès à présent y accéder via l’API, le démonstrateur ou les widgets en sélectionnant le […]

Journée de la terre

Journée de la terre


La planète célèbre la Journée de la Terre ce vendredi 22 avril 2016. Cette année, la journée de la terre sera consacrée aux arbres. L’équipe ISTEX-DATA en profite pour faire un focus sur quelques revues ‘phares’ dans le domaine de l’écologie. Certaines publications à très haut facteur d’impact, référencées dans le JCR 2014, font parties des corpus ISTEX et nous […]

Avant-première et sondage utilisateurs : Facettes imbriquées

Avant-première et sondage utilisateurs : Facettes imbriquées


Chers utilisatrices et utilisateurs, Nous avons mis en place sur notre API d’intégration une nouvelle fonctionnalité : les facettes imbriquées. Il s’agit, à partir d’un premier filtre sur une collection, de pouvoir peaufiner encore plus ce filtrage. Un exemple étant beaucoup plus parlant, admettons que l’on cherche à connaître l’ensemble des corpus présents dans l’API (champ corpusName de l’API) et, pour […]