Un corpus gold standard pour le TDM

Un corpus gold standard pour le TDM


A la demande du Laboratoire d’Informatique Fondamentale et Appliquée de Tours (LIFAT), un corpus de documents ISTEX a été annoté manuellement par huit personnes à l’Inist-CNRS, avec un calcul d’accord inter annotateurs effectué au LIFAT et à l’Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA). Ce corpus gold standard est destiné aux chercheurs désirant tester ou entraîner leur outil […]

ISTEX-DL se met sur son 4.21 et sort le grand jeu

ISTEX-DL se met sur son 4.21 et sort le grand jeu


Plus de 9 mois après la sortie de la version 4.19, que nous vous avions présentée dans un précédent billet de blog, nous avons le plaisir de vous annoncer la disponibilité de la version 4.21 d’ISTEX-DL. Cette version est l’aboutissement d’une démarche visant à vous offrir une meilleure expérience utilisateur. Cela se traduit par un certain nombre de nouveautés et […]

RSL, un corpus éditeur ISTEX de classe royale

RSL, un corpus éditeur ISTEX de classe royale


Chers utilisateurs et utilisatrices, C’est avec grand-plaisir que nous vous annonçons la mise en ligne du corpus ISTEX des revues de la « Royal Society of London » (RSL). Pour mémoire, cette institution de renom a compté nombre de savants célèbres et estimés. Parmi eux, on pourra citer Isaac Newton, qui l’a lui-même présidé. Vous pourrez donc retrouver quelques-uns des articles écrits […]

Ateliers pratiques sur l’usage des ressources ISTEX

Ateliers pratiques sur l’usage des ressources ISTEX


  Après le franc succès remporté par ISTEX-Tour, nous repartons sur les routes pour venir à votre rencontre et partager notre expérience sur l’exploitation des ressources et des services ISTEX pour un usage en fouille de textes. En partenariat avec la DIST et les URFIST, l’équipe ISTEX de l’Inist a élaboré un atelier pratique qui vous accompagnera dans la prise […]

« Lecture Notes in Computer Science (LNCS) » dans Springer e-books!

« Lecture Notes in Computer Science (LNCS) » dans Springer e-books!


    Certains d’entre vous ont peut-être remarqué que depuis le 23 avril 2019, sans nouvelles ingestions de corpus éditeurs , l’API-ISTEX compte 295 884 objets documentaires de plus, dépassant ainsi la barre des 22 millions. soit  22 195 149 documents !   Il s’agit en fait du retour des  « Lecture Notes in Computer Science (LNCS)« , devenus indisponibles depuis décembre […]

Revue-sommaire ou comment  améliorer les données du corpus Elsevier?

Revue-sommaire ou comment améliorer les données du corpus Elsevier?


  Depuis janvier 2019 un nouveau mode d’accès aux ressources ISTEX est disponible sur data.istex.fr, l’instance Revue-Sommaire . Cette présentation  par titre de publication puis année/volume/numéro/article, telle que les éditeurs nous le proposent actuellement sur leurs sites, a l’avantage d’être le reflet exact des ressources disponibles sur la plateforme ISTEX.   Cette présentation du corpus Elsevier dans Revue-Sommaire a permis […]

Mise en ligne du corpus « Brepols -ebooks »

Mise en ligne du corpus « Brepols -ebooks »


L’équipe ISTEX a le plaisir de vous annoncer que le corpus « Brepols-ebooks » est désormais disponible sur la plateforme ISTEX.   Ce corpus compte 848 titres dans les domaines de l’histoire ancienne et médiévale, littérature, linguistique, pensée et théologie médiévales. => soit 15 349 documents de niveau chapitre de plus dans ISTEX Les textes majoritairement en langue anglaise comportent […]

Corpus spécialisés : Astrophysique

Corpus spécialisés : Astrophysique


Définir l’Astrophysique avec Istex : une gageure ? C’est en tout cas l’ambition visée par cette collection qui vient agrandir la famille des corpus spécialisés. Pour l’équipe Terminologie-TAL de l’Inist, désireuse d’enrichir des ressources terminologiques en Astrophysique par des définitions de concepts, le défi consiste non seulement à détecter ces définitions dans des textes spécialisés grâce à l’outil de reconnaissance d’information Unitex-CasSys, […]

Corpus spécialisés : Systématique

Corpus spécialisés : Systématique


Nouvelle publication sur la plateforme data.istex.fr : Collection Systématique Cette collection regroupe des corpus constitués de documents en texte intégral issus du fonds ISTEX et appartenant à la thématique de la classification scientifique des espèces animales et végétales. Ils sont utilisés par ISTEX pour tester l’outil entity-fishing de la société Science Miner. Cet outil détecte dans le texte intégral les […]

Corpus spécialisés : Unitex

Corpus spécialisés : Unitex


Nouvelle publication sur la plateforme data.istex.fr : Collection Unitex Cette collection regroupe des corpus de documents ISTEX en texte intégral, non thématiques, constitués dans le but d’évaluer la détection d’entités nommées par l’outil Unitex-CasSys. Le logiciel Unitex traite des corpus de textes en langue naturelle à l’aide d’une cascade de reconnaissance des entités nommées implantée avec le programme de création […]