Corpus spécialisés : Unitex

Corpus spécialisés : Unitex


Nouvelle publication sur la plateforme data.istex.fr : Collection Unitex Cette collection regroupe des corpus de documents ISTEX en texte intégral, non thématiques, constitués dans le but d’évaluer la détection d’entités nommées par l’outil Unitex-CasSys. Le logiciel Unitex traite des corpus de textes en langue naturelle à l’aide d’une cascade de reconnaissance des entités nommées implantée avec le programme de création […]

Extraire un corpus ISTEX : 4 solutions

Extraire un corpus ISTEX : 4 solutions


    Dans un billet précédent, l’équipe Istex-Corpus vous présentait l’application conviviale de téléchargement de corpus: ISTEX-DL¹. Trois autres outils sont à votre disposition pour extraire un corpus de documents numériques de l’archive ISTEX, chacun possédant ses spécificités et ses avantages propres. Vous interrogez déjà le réservoir ISTEX directement via son API ? Vous serez peut-être intéressés par l’utilisation de la […]

Corpus spécialisés : Vieillissement

Corpus spécialisés : Vieillissement


Nouvelle publication sur la plateforme data.istex.fr : Collection Vieillissement La thématique du vieillissement était l’une de celles retenues en septembre 2014, lors de la première rencontre des partenaires du projet ISTEX : HUMA-NUM, INRIA, Université d’Aix-Marseille, Université de Lorraine, Université de Nantes – LINA, Université de Tours – LI, Inist-CNRS. Cette thématique regroupe le vieillissement humain normal (psychologie, physiologie, gérontologie) et […]

Corpus spécialisés : Orthophonie

Corpus spécialisés : Orthophonie


L’équipe ISTEX-Corpus publie une nouvelle collection de corpus sur la plateforme data.istex.fr. Cette collection contient la première version d’un corpus de documents en texte intégral issus de la plateforme ISTEX et traitant du domaine de l’orthophonie. Ce premier corpus comporte 39 documents en français. Il a été constitué en 2017 dans le but de venir augmenter, par de nouvelles ressources, […]

Corpus spécialisés : Food Science and Technology

Corpus spécialisés : Food Science and Technology


L’équipe ISTEX-Corpus publie une première collection de corpus spécialisés sur data.istex.fr : Collection Food S&T Cette collection contient un corpus créé à partir de la thématique « Food Science and Technology » du Web of Science. Parmi les thématiques retenues lors de la première réunion des partenaires du projet ISTEX en septembre 2014 (Diabète, Cancer du sein, Vieillissement, Astrophysique, Energie éolienne, Agro-alimentaire, […]

Corpus spécialisés : publication sur data.istex

Corpus spécialisés : publication sur data.istex


L’équipe ISTEX-Corpus met à votre disposition ses corpus spécialisés en les exposant sur le web à travers la plateforme data.istex.fr. Il s’agit de corpus de documents en texte intégral issus de la plateforme ISTEX et rassemblés autour d’une thématique ou d’un domaine scientifique en vue d’une exploitation en traitement automatique des langues et en fouille de textes. Vous pouvez naviguer […]

ISTEX-DL : Vous en rêviez, ISTEX l’a fait !

ISTEX-DL : Vous en rêviez, ISTEX l’a fait !


  À tous ceux qui ont un jour rêvé d’un filet miraculeux, capturant sans peine dans le grand fonds ISTEX les publications après lesquelles ils soupiraient, notre interface de téléchargement est faite pour eux. Lancée en septembre 2017, l’application ISTEX Download (ou ISTEX-DL) aujourd’hui a fait peau neuve.   Dans une version revisitée aux couleurs d’ISTEX, elle vous offre désormais […]

Documentation sur la constitution de corpus thématiques

Documentation sur la constitution de corpus thématiques


Pour démarrer cette nouvelle année, l’équipe ISTEX-CORPUS met en ligne une documentation destinée à répondre aux questions des utilisateurs d’ISTEX désireux de constituer un corpus de textes intégraux à partir de l’API, en vue d’une utilisation éventuelle en traitement automatique du langage (TAL) ou en fouille de textes et de données (TDM). Cette documentation présente des conseils et des astuces […]