Des ARK dans ISTEX

Classé dans : Divers | 0

Chères utilisatrices et utilisateurs,

L’équipe ISTEX a le plaisir de vous annoncer que dans les semaines à venir, les documents disponibles dans la plateforme ISTEX vont s’enrichir d’un nouveau système d’identification pérenne : “ARK” (Archival Resource Key). Ce mécanisme, mis en place par la “CDL” (California Digital Library), est déjà utilisé par la BNF (Bibliothèque Nationale de France).

Qu’est-ce qui change pour vous ?

  • Jusqu’à aujourd’hui, un lien vers un document ISTEX ressemblait à ceci :

https://api.istex.fr/document/087661D669BF44CA05AA6CE08ADD6399F6A439C4/fulltext/pdf

  • À partir de maintenant, vous pourrez accéder à ce même document avec ce type d’URL :

https://api.istex.fr/ark:/67375/GT4-FJLCPBW9-Q/fulltext.pdf

NB : Ce nouveau type d’accès viendra en complément de l’accès par identifiant ISTEX, il n’a pas vocation à le remplacer.

Comment une URL de type ARK est-elle construire ?

On peut décomposer une URL d’accès à un document ISTEX via son identifiant ARK ainsi :

On peut voir sur ce schéma que le cœur de l’URL est son « nom ARK » (encadré rouge), partie identifiant de manière unique ce document parmi l’ensemble des ARK existant par ailleurs.

Quel est l’intérêt des ARK dans ISTEX ?

La mise en place des ARK a de nombreux avantages, dont la gratuité d’attribution contrairement au DOI.

D’autres avantages sont :

  1. La citabilité facilitée, grâce à une chaîne de caractères plus petite que l’identifiant ISTEX à 40 caractères.
  2. La lisibilité améliorée, grâce à une hiérarchisation bien identifiée :
    1. Le NAAN, numéro attribué par la CDL, qui identifie l’institution habilitée à attribuer des ARK (67375 pour l’INIST-CNRS).
    2. Le Subpublisher, première partie de l’ARK, qui caractérise le bouquet éditeur (GT4 pour le corpus « Nature »).
    3. Une identification de la typologie du document (fulltext) et du format (pdf), rendue possible par les qualificatifs.

À terme, l’utilisation de qualificatifs permettrait notamment de pointer jusqu’à une page précise ou un mot du document.

Enfin, pour vous garantir la pérennité des identifiants ARK, nous avons mis en place des moyens techniques adéquats, avec notamment des sauvegardes quotidiennes.

Quels documents sont concernés ?

Dès à présent, l’ensemble des documents des corpus « Nature » et « Cambridge » possèdent un ARK. Nous attribuerons progressivement des ARK aux autres corpus dans les semaines à venir.

Dans la pratique, les identifiants ARK ayant été attribués sont reportés pour chaque document dans les formats suivants :

  • Mods (ex : ark:/67375/GT4-FJLCPBW9-Q)
  • TEI (ex : ark:/67375/GT4-FJLCPBW9-Q)
  • JSON (dans le champ arkIstex)
  • et partout où c’est pertinent !

Bien entendu, l’ensemble des formats disponibles à partir d’un identifiant ISTEX sont également accessible via l’identifiant ARK. Pour cela, il suffit d’utiliser les qualificatifs (typologie et format) adéquats.

La documentation de l’API a été mise à jour. Elle détaille notamment les différentes routes d’accès de type ARK.

N’hésitez pas à nous faire part de vos questions ou remarques.

Bonne consultation

L’équipe ISTEX

En savoir plus : http://www.bnf.fr/fr/professionnels/issn_isbn_autres_numeros/a.ark.html

PS : Merci à la BNF pour son schéma décrivant la structure d’URL, que nous avons reproduit pour nos propres besoins.