ISTEX-Tour  en quelques dates!

ISTEX-Tour en quelques dates!


            Réalisé : 25-27 septembre 2018         Congrès ADBU – stand exposant (Brest) 3-5 octobre                             Journées FREDOC (Albi)  9 octobre                               IRD, Agropolis et université de Montpellier 10 octobre                              Université de Toulouse et Réseau URFIST   En cours : 16 octobre                              Université de Lyon1 et INSA 16 octobre                              CHU Lyon 17 octobre                              […]

Analyse quantitative de l’archive ISTEX (3)

Analyse quantitative de l’archive ISTEX (3)


un peu plus compliqué … Lors des deux billets précédents nous avons présenté la possibilité de dénombrer un item dans un triplestore. Le langage SPARQL donne la possibilité d’exprimer des résultats de requêtes en  pourcentage. Pour illustrer cette possibilité nous allons calculer la répartition “catégorie inist” pour le content type « papier de recherche »@fr, exprimée en pourcentage. La requête suivante est […]

Analyse quantitative de l’archive ISTEX (2)

Analyse quantitative de l’archive ISTEX (2)


Dans le précédent billet, nous avons présenté une requête SPARQL permettant de dénombrer des objets appartenant à un même graphe (ou jeux de données). Ici, nous nous attarderons à construire une requête portant sur deux graphes différents. Pour cela, nous analyserons la répartition des catégories inist pour le content type « papier de recherche »@fr ; les résultats seront donnés en nombre […]

Analyse quantitative de l’archive ISTEX (1)

Analyse quantitative de l’archive ISTEX (1)


Combien y a-t-il de documents correspondant au type de document (ou genre) «papier de recherche » ; combien y a-t-il de documents correspondant à l’éditeur scientifique d’ISTEX  « rsl »  contenu dans l’archive documentaire istex (www.istex.fr) ? Questions auxquelles il est difficile d’y répondre en consultant la plateforme dédiée … Néanmoins, ces questions trouvent leurs réponses en interrogeant le triplestore correspondant à cette archive  https://data.istex.fr/triplestore/sparql/. […]

Le langage SPARQL au service d’ISTEX (3)

Le langage SPARQL au service d’ISTEX (3)


Lors des deux précédents billets, nous avons vu comment l’utilisation du langage SPARQL favorisait la valorisation du fonds documentaire ISTEX. Pour poursuivre dans cette voie, en interne nous avons développé un mode d’interrogation SPARQL qui présente la particularité d’enrichir dynamiquement les ressources présentent dans un  jeu de données. Ce mode d’interrogation SPARQL, implémenté dans l’outil LODEX utilisé pour publier les différents […]

Le langage SPARQL au service d’ISTEX (2)

Le langage SPARQL au service d’ISTEX (2)


Dans le précédent billet de blog, il a été présenté l’alimentation du SPARQL endpoint (http://data.istex.fr/triplestore/sparql). Si nous nous intéressons maintenant de plus près aux jeux de données scopus-category, wos-category, sciencemetrix-category et Inist-category, nous pouvons constater la présence de différents alignements (flèche rouge) entre eux et vers des référentiels extérieurs (voir figure 1). A partir de https://data.istex.fr/, si nous consultons par […]

Le langage SPARQL au service d’ISTEX (1)

Le langage SPARQL au service d’ISTEX (1)


A partir du fonds documentaire ISTEX (https://www.istex.fr/) différents jeux de documents ou de données ont été constitués à partir d’informations extraites automatiquement (entités nommées, catégories scientifiques, etc.) ou bien à partir des informations induites et produites par les documentalistes (types de documents, regroupement des langues, etc.). Chaque jeux de données est constitué d’un ensemble de ressources. Ces dernières ont fait […]

Triple Store: chargement des 43 millions de triplets

Triple Store: chargement des 43 millions de triplets


Pour la première fois, l’équipe ISTEX-LOD a chargé dans son Triple Store les triplets faisant le lien entre les ressources d’un jeu et les documents ISTEX correspondant. En l’occurrence, il s’agit du jeu inist-category (contenant les valeurs de la facette categories.inist). C’est le premier maillon d’une chaîne qui permettra, en faisant de même pour tous les jeux de données de […]