Revue-sommaire ou comment améliorer les données du corpus Elsevier?


 

Depuis janvier 2019 un nouveau mode d’accès aux ressources ISTEX est disponible sur data.istex.fr, l’instance Revue-Sommaire .

Cette présentation  par titre de publication puis année/volume/numéro/article, telle que les éditeurs nous le proposent actuellement sur leurs sites, a l’avantage d’être le reflet exact des ressources disponibles sur la plateforme ISTEX.

 

Cette présentation du corpus Elsevier dans Revue-Sommaire a permis à l’équipe ISTEX de naviguer dans toutes les Années Volumes Issues et Articles des 2266 titres présents sur la plateforme ISTEX.

Cet énorme travail de vérification a mis en évidence environ 2500 erreurs différentes sur :

  • CAS 1: Erreur de répartition de volumes par année

Exemple avec le titre Tubercle  le vol 27 num 11 de 1964 appartient à l’année 1946 (l’année 1964 est la date de copyright de ce volume et non sa date de publication).

  • CAS 2: Titres ne ramenant pas de résultats car non présents dans l’api ISTEX

  • CAS 3: Titres ne ramenant pas de résultats et présents dans l’api ISTEX

Parfois ISSN erroné ou défaut d’écriture, ou eISSN à la place d’ISSN attendu

Exemple avec la revue Artificial intelligence (General ed.):

Artificial intelligence (General ed.) 1530-261X issn 1530-261X ne ramène rien mais ce titre est présent dans l’API oui problème eissn et issn/ok corrigé dans requête revue de sommaire/ ajout ISSN

1- Dans le cas 1 suite à l’étude des erreurs trouvées (années erronées), une table de correspondance a été réalisée  listant les volumes et les années attendus pour permettre ensuite d’être intégrée dans la feuille de transformation Elsevier en vue d’un rechargement de ce corpus éditeur dans la plateforme ISTEX . Suite à ce rechargement, les corrections apportées sont immédiatement visibles dans revue-sommaire .

2- Pour le cas 2, ce n’est pas dans la feuille de style que les corrections vont être apportées mais directement dans l’instance Revue-Sommaire.

Pour un titre et un ISSN donné aucune couverture présente. La première étape consiste à vérifier l’exactitude des données en se rendant sur le catalogue de la NLM.

On constate que le titre retrouvé ne correspond pas au titre signalé dans Revue-Sommaire mais à un changement de titre.

Il faut donc pour tous les titres retrouvés se focaliser sur la ligne « continues » ou « continued By »et récupérer l’ISSN associé.

La force de LODEX « un CMS dédié aux données structurées construit pour ISTEX et utilisable par tous » c’est de pouvoir rajouter des informations sous forme de champs éditables et personnalisables.

Dans l’instance Revue-Sommaire,

 

pour les titres ne ramenant aucun résultat (état de collection) (fiche A):

  • ajout d’une nouvelle information  dans un champ nommé « DEVIENT« 
  • redirection par lien vers le titre  du journal publié par la suite, contenu dans revue-sommaire et présentant un état de collection exhaustif pour ces 2 journaux.

pour les titres en lien avec les titres vides (fiche B):

  • ajout du lien vers le titre vide dans un champ nommé « SUITE DE » pour informé l’utilisateur de l’historique de cette revue

 

3- Pour le cas 3, nous nous sommes aperçus suite à notre étude que parfois l’état de collection de certain titre était vide alors que le titre était bien présent dans l’API ISTEX. Ce qui s’explique par la non concordance entre l’ISSN (moyen d’interrogation de l’API) contenu dans les tableaux KBART et l’ISSN déclaré dans les métadonnées. Malgré un nombre faible, nous avons relevés des erreurs d’écriture (chiffres inversés), des erreurs de eISSN mis à la place d’ISSN et des ISSN n’étant pas présents dans nos fichiers KBART (ISSN très anciens).

Pour la correction de ces cas, nous avons soit:

  • corrigé les ISSN erronés en masse via la feuille de transformation
  • corrigé à la main les cas particuliers dans revue-sommaire
  • recherché le titre de la revue incriminée en abandonnant les informations ISSN et en ciblant le titre (requête elastic-search)

 

N’hésitez pas à nous signaler les problèmes rencontrés, des améliorations et/ou corrections peuvent être possibles.

 

Stéphanie Gregorio, Pascale Viot et Edith Neveu pour l’équipe ISTEX

 

Liens utiles :

Billet blog revue-sommaire 


Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *