Analyse quantitative de l’archive ISTEX (3)

Analyse quantitative de l’archive ISTEX (3)


un peu plus compliqué … Lors des deux billets précédents nous avons présenté la possibilité de dénombrer un item dans un triplestore. Le langage SPARQL donne la possibilité d’exprimer des résultats de requêtes en  pourcentage. Pour illustrer cette possibilité nous allons calculer la répartition “catégorie inist” pour le content type « papier de recherche »@fr, exprimée en pourcentage. La requête suivante est […]

Analyse quantitative de l’archive ISTEX (2)

Analyse quantitative de l’archive ISTEX (2)


Dans le précédent billet, nous avons présenté une requête SPARQL permettant de dénombrer des objets appartenant à un même graphe (ou jeux de données). Ici, nous nous attarderons à construire une requête portant sur deux graphes différents. Pour cela, nous analyserons la répartition des catégories inist pour le content type « papier de recherche »@fr ; les résultats seront donnés en nombre […]

Analyse quantitative de l’archive ISTEX (1)

Analyse quantitative de l’archive ISTEX (1)


Combien y a-t-il de documents correspondant au type de document (ou genre) «papier de recherche » ; combien y a-t-il de documents correspondant à l’éditeur scientifique d’ISTEX  « rsl »  contenu dans l’archive documentaire istex (www.istex.fr) ? Questions auxquelles il est difficile d’y répondre en consultant la plateforme dédiée … Néanmoins, ces questions trouvent leurs réponses en interrogeant le triplestore correspondant à cette archive  https://data.istex.fr/triplestore/sparql/. […]

Le langage SPARQL au service d’ISTEX (2)

Le langage SPARQL au service d’ISTEX (2)


Dans le précédent billet de blog, il a été présenté l’alimentation du SPARQL endpoint (http://data.istex.fr/triplestore/sparql). Si nous nous intéressons maintenant de plus près aux jeux de données scopus-category, wos-category, sciencemetrix-category et Inist-category, nous pouvons constater la présence de différents alignements (flèche rouge) entre eux et vers des référentiels extérieurs (voir figure 1). A partir de https://data.istex.fr/, si nous consultons par […]

Le langage SPARQL au service d’ISTEX (1)

Le langage SPARQL au service d’ISTEX (1)


A partir du fonds documentaire ISTEX (https://www.istex.fr/) différents jeux de documents ou de données ont été constitués à partir d’informations extraites automatiquement (entités nommées, catégories scientifiques, etc.) ou bien à partir des informations induites et produites par les documentalistes (types de documents, regroupement des langues, etc.). Chaque jeux de données est constitué d’un ensemble de ressources. Ces dernières ont fait […]