Analyse quantitative de l’archive ISTEX (3)


un peu plus compliqué …

Lors des deux billets précédents nous avons présenté la possibilité de dénombrer un item dans un triplestore.

Le langage SPARQL donne la possibilité d’exprimer des résultats de requêtes en  pourcentage. Pour illustrer cette possibilité nous allons calculer la répartition “catégorie inist” pour le content type « papier de recherche »@fr, exprimée en pourcentage.

La requête suivante est construite :

SELECT ?libellecatinist (count(?libellecatinist) as ?totallibellecatinist) (count (?libellecatinist)*100/?totalcontentTypePDR as ?percent)

where

{

{

select ?libellecatinist

 where

 {

?docistex <https://data.istex.fr/ontology/istex#contentType> ?conttype.

?conttype <http://www.w3.org/2004/02/skos/core#altLabel> « papier de recherche »@fr.

?docistex <https://data.istex.fr/ontology/istex#subjectInist> ?catinist.

?catinist <http://www.w3.org/2004/02/skos/core#prefLabel> ?libellecatinist.

   filter(lang(?libellecatinist)= « fr »)

}

}

{

 select (count(?docistex) as ?totalcontentTypePDR)

 where

{  

?docistex <https://data.istex.fr/ontology/istex#contentType> ?conttype.

 ?conttype <http://www.w3.org/2004/02/skos/core#altLabel> « papier de recherche »@fr.}

}

}

order by desc (?percent)

La clause select mentionne que nous calculons et affichons le nombre total des catégories inist :   (count(?libellecatinist) as ?totallibellecatinist) puis nous exprimons en pourcent la répartitions de ces catégories et nous affichons    (count (?libellecatinist)*100/?totalcontentTypePDR as ?percent)

La clause where est construite par deux étapes  successives.

La première permet d’identifier les catégories inist (avec un libellé français) affectées aux documents istex du type “papier de recherche”. La seconde, permet de sélectionner l’ensemble des documents istex ayant pour content type “papier de recherche”. Ce dernier calcul servira de dénominateur pour notre ratio.

Puis nous demandons d’afficher les résultats exprimés en pourcent par ordre décroissant.

Pour accéder au résultat de la requête, nous vous invitons à cliquer ICI.

De plus, comme nous avons choisi YASGUI comme interface utilisateur de notre triplestore, nous bénéficions de certaines fonctionnalités d’affichage des résultats. Nous vous invitons à cliquer sur l’onglet “Google Chart” et de définir la représentation graphique que vous souhaitez pour afficher les résultats.

Par exemple, vous pouvez choisir la représentation en graphique secteurs :


Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *