25 juin 2015 | Team ISTEX | API , Développement

Mise en place des indicateurs de qualité


Chers utilisatrices et utilisateurs,

Nous venons d’achever un nouveau rechargement de corpus, avec son lot de nouveautés. Parmi elles, nous vous présentons ici la mise en place des indicateurs de qualité.

En effet, nous avons inséré un module dans notre chaîne d’ingestion ajoutant un champ qualityIndicators pour chaque objet documentaire. Ce dernier est, dans cette première version, renseigné par 7 champs :

Nous retrouvons la version du PDF, la présence de références bibliographiques fournies par l’éditeur, le nombre de mots et de caractères présent dans le PDF et le nombre de mots et de caractères présent dans le résumé.

Les 6 champs précédemment cités nous permettent d’introduire le septième champ : le score. Ce dernier nous aide à améliorer les résultats des recherches sur l’API : plus le score est important, plus ce dernier sera en tête des résultats. Pour savoir comment ce score est calculé, nous vous invitons à consulter la documentation de l’API ici. Le score évoluera par la suite avec l’apparition de nouveaux champs.

D’ailleurs, qui dit nouveaux champs dit intégration de nouvelles facettes. En effet, il est maintenant possible d’interroger l’API avec les facettes de même nom que le champ demandé :

de type range (comme copyrightDate), et

de type terms (comme corpusName)

Ces facettes ont également été implémentées au niveau du démonstrateur, consultable ici.

Pour toutes suggestions et/ou remarques, n’hésitez pas à nous laisser un commentaire !