Ajout de l’année 2015 au corpus Wiley

Ajout de l’année 2015 au corpus Wiley


Chers utilisateurs et utilisatrices, Nous avons le plaisir de vous annoncer la mise à jour du corpus Wiley, avec l’ajout des articles publiés en 2015. Cet ajout porte le nombre de documents de ce corpus à 5345607, soit un total de 21837390 tous corpus confondus. Une particularité de ce corpus est la mise à disposition d’un format TEI complet et structuré, […]

Le langage SPARQL au service d’ISTEX (2)

Le langage SPARQL au service d’ISTEX (2)


Dans le précédent billet de blog, il a été présenté l’alimentation du SPARQL endpoint (http://data.istex.fr/triplestore/sparql). Si nous nous intéressons maintenant de plus près aux jeux de données scopus-category, wos-category, sciencemetrix-category et Inist-category, nous pouvons constater la présence de différents alignements (flèche rouge) entre eux et vers des référentiels extérieurs (voir figure 1). A partir de https://data.istex.fr/, si nous consultons par […]

Le langage SPARQL au service d’ISTEX (1)

Le langage SPARQL au service d’ISTEX (1)


A partir du fonds documentaire ISTEX (https://www.istex.fr/) différents jeux de documents ou de données ont été constitués à partir d’informations extraites automatiquement (entités nommées, catégories scientifiques, etc.) ou bien à partir des informations induites et produites par les documentalistes (types de documents, regroupement des langues, etc.). Chaque jeux de données est constitué d’un ensemble de ressources. Ces dernières ont fait […]

Formation à l’utilisation de l’API ISTEX à Sciences Po Paris

Formation à l’utilisation de l’API ISTEX à Sciences Po Paris


 A la demande d’ Anna Couthures-Idrizi  et de Catherine Valais de Sciences Po, Pascale Viot et Claude Niederlender de l’équipe ISTEX se sont rendus dans leurs locaux du 199 boulevard Saint Germain, le mercredi 30 mai, afin de dispenser une formation complète sur l’utilisation de l’API ISTEX. Le profil des 8 personnes présentes était plutôt un profil documentaire.   Un grand […]

Un sid pour caractériser la voie d’accès à la plateforme ISTEX

Un sid pour caractériser la voie d’accès à la plateforme ISTEX


  En accédant à une ressource via Google Scholar, le bouton ISTEX,  la plateforme de téléchargement, BibCNRS etc…  vous avez peut-être remarqué qu’à la fin de l’URL vous avez un identifiant  « sid » qui varie en fonction de votre mode d’accès à la plateforme ISTEX :   Bouton ISTEX : sid=istex-browser-addon BibCNRS : sid=ebsco,istex-view Google Scholar : sid=google Téléchargement d’un corpus […]

Accès contrôlés aux ressources ISTEX

Accès contrôlés aux ressources ISTEX


Pour accéder aux ressources en accès contrôlé, 2 modes d’authentification sont possibles : – L’authentification par adresse IP – L’authentification par fédération d’identités Education-Recherche Pour rappel, seuls la recherche et l’accès aux métadonnées est en accès libre (formats JSON et MODS).   => L’authentification par adresse IP c’est ce qui vous permet, de façon transparente, d’accéder à un document ISTEX depuis […]

Triple Store: chargement des 43 millions de triplets

Triple Store: chargement des 43 millions de triplets


Pour la première fois, l’équipe ISTEX-LOD a chargé dans son Triple Store les triplets faisant le lien entre les ressources d’un jeu et les documents ISTEX correspondant. En l’occurrence, il s’agit du jeu inist-category (contenant les valeurs de la facette categories.inist). C’est le premier maillon d’une chaîne qui permettra, en faisant de même pour tous les jeux de données de […]

Mise en ligne du corpus Geological Society of London

Mise en ligne du corpus Geological Society of London


L’équipe ISTEX vous annonce la mise en production d’un nouveau corpus qui couvre le domaine de la géologie. The Geological Society est une société savante créée au tout début du XIXème siècle au Royaume-Uni. Fondée en 1807, c’est la plus ancienne société géologique dans le monde. Peu après sa création, la maison d’édition qui lui est associée, GSL Publishing, voit […]

Documentation sur la constitution de corpus thématiques

Documentation sur la constitution de corpus thématiques


Pour démarrer cette nouvelle année, l’équipe ISTEX-CORPUS met en ligne une documentation destinée à répondre aux questions des utilisateurs d’ISTEX désireux de constituer un corpus de textes intégraux à partir de l’API, en vue d’une utilisation éventuelle en traitement automatique du langage (TAL) ou en fouille de textes et de données (TDM). Cette documentation présente des conseils et des astuces […]

Mise en ligne du corpus « EDP Sciences»

Mise en ligne du corpus « EDP Sciences»


  L’équipe ISTEX a le plaisir de vous annoncer que le corpus « EDP Sciences » est désormais disponible sur la plateforme ISTEX.   Ce corpus contient les archives de 91 titres de revues publiés entre 1789 et 2014, dont les prestigieux titres « Journal de Physique » et « Le Radium ». Il couvre les domaines allant des mathématiques aux sciences du vivant en […]