Ajout de l’année 2015 au corpus Wiley

Ajout de l’année 2015 au corpus Wiley


Chers utilisateurs et utilisatrices, Nous avons le plaisir de vous annoncer la mise à jour du corpus Wiley, avec l’ajout des articles publiés en 2015. Cet ajout porte le nombre de documents de ce corpus à 5345607, soit un total de 21837390 tous corpus confondus. Une particularité de ce corpus est la mise à disposition d’un format TEI complet et structuré, […]

Mise en ligne du corpus Geological Society of London

Mise en ligne du corpus Geological Society of London


L’équipe ISTEX vous annonce la mise en production d’un nouveau corpus qui couvre le domaine de la géologie. The Geological Society est une société savante créée au tout début du XIXème siècle au Royaume-Uni. Fondée en 1807, c’est la plus ancienne société géologique dans le monde. Peu après sa création, la maison d’édition qui lui est associée, GSL Publishing, voit […]

Mise à jour du corpus Springer

Mise à jour du corpus Springer


Chers utilisateurs et utilisatrices, C’est avec un grand plaisir que nous vous annonçons la mise à jour du corpus Springer. Comme indiqué lors du précédent billet de blog, les documents de l’éditeur Springer sont à présent disponibles sous deux noms de corpus : springer-journals : pour tous les documents de type « article » springer-ebooks : pour tous les documents de type […]

Pub2TEI dans ISTEX

Pub2TEI dans ISTEX


Pub2TEI dans ISTEX : Les documents du corpus Wiley sont désormais proposés dans un format TEI (Text Encoding Initiative) développé par Pub2TEI et finalisé par l’équipe ISTEX-DATA avec des développements en interne (Pub2TEI version ISTEX) et la production d’un schéma ODD-ISTEX disponible sous github. Pour rappel, TEI est une norme de codage de structuration de textes qui repose sur XML. […]

Mise en ligne du corpus « Cambridge University Press »

Mise en ligne du corpus « Cambridge University Press »


Chers utilisatrices et utilisateurs, Nous avons le plaisir de vous informer que le corpus « Cambridge University Press » est à présent disponible sur la plateforme ISTEX. Ce corpus contient les archives de 312 titres de revues, publiés entre 1770 et 2010. D’un point de vue technique, ce corpus est constitué de 836 414 documents de niveau article, principalement en […]

Mise en ligne du corpus « Numérique premium »

Mise en ligne du corpus « Numérique premium »


Chers utilisatrices et utilisateurs, Nous venons tout juste de mettre en ligne le corpus « Numérique premium », première acquisition réalisée auprès d’un diffuseur français. Ce corpus est constitué de deux bouquets en langue française d’e-books en histoire et sciences humaines : « Littérature française et francophone » « Révolution française et Premier Empire ». Contrairement à notre habitude, et pour des raisons techniques, […]

Let’s go to the Pub(2TEI)

Let’s go to the Pub(2TEI)


L’équipe ISTEX-DATA entame le Sprint #10: « Let’s go to the Pub2TEI». Il a commencé vendredi 10 juin par sa planification et se terminera le 05 juin 2016 par sa revue de sprint. L’un des objectifs de ce sprint est la conversion des fichiers éditeurs en format TEI qui doit être expérimenté sur un corpus ayant du XML body éditeur (Nature […]

Sprint 9 ISTEX-DATA : Sélection officielle « Un certain regard documentaire »

Sprint 9 ISTEX-DATA : Sélection officielle « Un certain regard documentaire »


Bonjour,   L’équipe ISTEX-DATA entame le Sprint #9: « Sélection officielle « Un certain regard documentaire ». Il a commencé mardi 17 mai par sa planification et se terminera le 12 juin 2016 par sa revue de sprint. Voici la répartition de la charge de travail par thématique de travail, en fonction des points de complexité attribués par les membres de l’équipe. […]

Nouvelle version de l’API et mise à jour des corpus

Nouvelle version de l’API et mise à jour des corpus


Chères utilisatrices et utilisateurs, Vous avez peut-être constaté une légère instabilité de l’API ISTEX depuis hier après-midi… nous en sommes désolé, cela était lié à une mise en production un peu difficile. Les soucis ont été résolus aujourd’hui en fin de matinée. En contrepartie, nous venons de mettre à disposition une nouvelle version de l’API, estampillée 3.7.1. Cette version de […]

RSC : après les e-books, les journals !

RSC : après les e-books, les journals !


Chers utilisatrices et utilisateurs,   Après la mise en ligne récente des e-books de l’éditeur RSC, nous venons de mettre à disposition le corpus « journals » de l’éditeur RSC. (petit nom : rsc-journals) Ce corpus contient pour l’instant des articles de revue publiés entre 1841 et 2007. Le nombre d’articles disponibles est de 258 515, ce qui porte le nombre total […]