e-Éducation : un corpus d’actualité en SHS

e-Éducation : un corpus d’actualité en SHS


Les médias nous informent sur les difficultés rencontrées par les enseignants et les étudiants pour mener à bien leur travail face à la réalité sociale du confinement. L’équipe ISTEX présente un corpus d’actualité qui offre un regard et peut-être des solutions à cette situation. L’archive ISTEX éclaire ce que nous vivons aujourd’hui avec des articles publiés entre 1976 et 2016 […]

Un corpus gold standard pour le TDM

Un corpus gold standard pour le TDM


A la demande du Laboratoire d’Informatique Fondamentale et Appliquée de Tours (LIFAT), un corpus de documents ISTEX a été annoté manuellement par huit personnes à l’Inist-CNRS, avec un calcul d’accord inter annotateurs effectué au LIFAT et à l’Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA). Ce corpus gold standard est destiné aux chercheurs désirant tester ou entraîner leur outil […]

Des archives à l’actualité, c’est possible avec ISTEX!

Des archives à l’actualité, c’est possible avec ISTEX!


Depuis plusieurs mois « la covid 19 » (covid 19 disease) dû à un coronavirus sévit dans le monde. Bien que tous les coronavirus n’ont pas un pouvoir hautement pathogène, comment oublier l’épidémie de SRAS (Syndrome Respiratoire Aigu Sévère) de 2002 et de MERS (Syndrome Respiratoire du Moyen-Orient) de 2012 ? Ces 2 épidémies, à fort tropisme pulmonaire, peuvent nous apporter des […]

Beethoven250@ISTEX : écouter Beethoven autrement

Beethoven250@ISTEX : écouter Beethoven autrement


16 décembre 1770 : Ludwig van Beethoven naît dans la ville allemande de Bonn et deviendra le compositeur que l’on sait. 250 ans plus tard, son héritage ne se résume pas à ses œuvres musicales. Nombre d’écrits ont été publiés au fil des siècles sur sa musique, ses liens avec ses contemporains et ses héritiers, mais aussi sur sa vie, […]

Plongez au cœur d’ISTEX grâce à ses enrichissements

Plongez au cœur d’ISTEX grâce à ses enrichissements


Féru d’égyptologie, vous souhaitez exhumer tous les textes évoquant le pharaon Toutânkhamon ?  Alpiniste émérite, vous voulez explorer les articles scientifiques qui mentionnent l’Everest ? A la recherche du grand frisson, vous rêvez de vibrer aux écrits nommant le cosmonaute Youri Gagarine ? Ou de prendre le large avec l’explorateur Louis-Antoine de Bougainville ? Vous êtes à la recherche de toutes […]

Ateliers pratiques sur l’usage des ressources ISTEX

Ateliers pratiques sur l’usage des ressources ISTEX


  Après le franc succès remporté par ISTEX-Tour, nous repartons sur les routes pour venir à votre rencontre et partager notre expérience sur l’exploitation des ressources et des services ISTEX pour un usage en fouille de textes. En partenariat avec la DIST et les URFIST, l’équipe ISTEX de l’Inist a élaboré un atelier pratique qui vous accompagnera dans la prise […]

Corpus spécialisés : Astrophysique

Corpus spécialisés : Astrophysique


Définir l’Astrophysique avec Istex : une gageure ? C’est en tout cas l’ambition visée par cette collection qui vient agrandir la famille des corpus spécialisés. Pour l’équipe Terminologie-TAL de l’Inist, désireuse d’enrichir des ressources terminologiques en Astrophysique par des définitions de concepts, le défi consiste non seulement à détecter ces définitions dans des textes spécialisés grâce à l’outil de reconnaissance d’information Unitex-CasSys, […]

Corpus spécialisés : Systématique

Corpus spécialisés : Systématique


Nouvelle publication sur la plateforme data.istex.fr : Collection Systématique Cette collection regroupe des corpus constitués de documents en texte intégral issus du fonds ISTEX et appartenant à la thématique de la classification scientifique des espèces animales et végétales. Ils sont utilisés par ISTEX pour tester l’outil entity-fishing de la société Science Miner. Cet outil détecte dans le texte intégral les […]

Corpus spécialisés : Unitex

Corpus spécialisés : Unitex


Nouvelle publication sur la plateforme data.istex.fr : Collection Unitex Cette collection regroupe des corpus de documents ISTEX en texte intégral, non thématiques, constitués dans le but d’évaluer la détection d’entités nommées par l’outil Unitex-CasSys. Le logiciel Unitex traite des corpus de textes en langue naturelle à l’aide d’une cascade de reconnaissance des entités nommées implantée avec le programme de création […]

Extraire un corpus ISTEX : 4 solutions

Extraire un corpus ISTEX : 4 solutions


    Dans un billet précédent, l’équipe Istex-Corpus vous présentait l’application conviviale de téléchargement de corpus: ISTEX-DL¹. Trois autres outils sont à votre disposition pour extraire un corpus de documents numériques de l’archive ISTEX, chacun possédant ses spécificités et ses avantages propres. Vous interrogez déjà le réservoir ISTEX directement via son API ? Vous serez peut-être intéressés par l’utilisation de la […]