Documentation sur les enrichissements

Classé dans : ISTEX-R&D | 0

En lien avec l’équipe Triplex du DPI, l’équipe Istex-rd a publié la documentation relative aux outils utilisés pour produire des enrichissements dans Istex.

https://enrichmenttool-list.data.istex.fr/home

L’expérimentation Triplex, à l’aide de l’outil Lodex, permet de transformer une série d’informations répertoriées dans un tableau Excel en un jeu de données publiable sur https://data.istex.fr et interopérable via un SPARQL-endpoint. Ce jeu de données apporte une documentation sur les facettes des types d’enrichissements que vous trouvez sur l’API-ISTEX, en explicitant les requêtes constituées à partir de ces facettes.

Pour chaque outil produisant un enrichissement, on retrouve :

  • Un identifiant ARK (Archival Resource Key) attribué à chaque information et permettant une identification pérenne de l’objet auquel il est attribué,
  • Le nom de l’outil et sa description,
  • Le nom de la facette apparaissant dans l’API d’Istex et offrant la possibilité de faire une requête sur l’enrichissement considéré,
  • Le type d’enrichissement apporté par l’outil (indexation, catégorisation, reconnaissance d’entités nommées, structuration des références bibliographiques,…)
  • Les contraintes inhérentes à l’outil, comme par exemple le fait de ne traiter que le plein texte,
  • Les partenaires œuvrant avec Istex-rd à l’optimisation d’un outil (exemple: le Laboratoire d’Informatique de l’Université François Rabelais de Tours pour Unitex-CasSys),
  • Les ressources éventuellement utilisées par l’outil, ainsi que la description les concernant.

Pour retrouver toutes les informations :

Explorer les ressources intégrées dans ISTEX : https://data.istex.fr

Jeu de données enrichissements : https://enrichmenttool-list.data.istex.fr/home

SPARQL-endpoint: https://data.istex.fr/sparql

Formulaire de SPARQL intuitif: https://data.istex.fr/yasgui.html

Laissez un commentaire