Le langage SPARQL au service d’ISTEX (2)


Dans le précédent billet de blog, il a été présenté l’alimentation du SPARQL endpoint (http://data.istex.fr/triplestore/sparql).

Si nous nous intéressons maintenant de plus près aux jeux de données scopus-category, wos-category, sciencemetrix-category et Inist-category, nous pouvons constater la présence de différents alignements (flèche rouge) entre eux et vers des référentiels extérieurs (voir figure 1).

zoom sur les jeux de données catégories dans data-istex.
figure 1 : zoom sur les jeux de données catégories dans data-istex.

A partir de https://data.istex.fr/, si nous consultons par exemple la ressouce “Microbiologie appliquée et biotechnologieappartenant au jeu de  données “scopus-category” (https://scopus-category.data.istex.fr/ark:/67375/G19HBF9BG5-Z), nous constatons que ce concept possède un équivalent dans la classification sciencemetrix et un équivalent dans la classification wos (figure 2).

exemple du concept Microbiologie appliquée et biotechnologie dans le jeu scopus-category.
figure 2 : exemple du concept Microbiologie appliquée et biotechnologie dans le jeu scopus-category.

Il est à noter que les alignements manuels n’ont pas été réalisés pour l’ensemble des jeux de données. Dans notre exemple cité dans la figure 2, nous n’avons pas de mention d’alignement avec le jeu inist-category. De manière générale, se pose la question de comment extraire automatiquement les relations entre toute ces classifications par transitivité (flèches noires de la figure 1).

Après quelques essais pour se familiariser au langage SPARQL, la puissance de ces requêtes SPARQL en est la réponse. Dans notre exemple, pour obtenir les relations entre les 4 plans de classement utilisés lors de l’enrichissement du fonds  Istex il suffit de construire la requête suivante :

Il s’en suit les résultats suivants :

 

Cette visualisation simultanée des quatre classifications peut faciliter la recherche avancée du fonds ISTEX (https://www.istex.fr/).