Export de sous-corpus, disponible en intégration

Classé dans : API, Développement | 0

Bonjour,

Une nouvelle fonctionnalité vient de faire son apparition sur l’API : l’extraction (ou export) de sous-corpus. Celle-ci est disponible sur la version d’intégration (api-integ.istex.fr).

Grâce à cette fonctionnalité, vous serez en capacité de demander à l’API de vous fournir une archive ZIP contenant les fichiers relatifs aux documents correspondants à votre recherche.

Pour ceux et celles d’entre vous qui profitent d’une connexion internet très rapide, vous remarquerez peut-être que cette extraction est moins performante que lorsque vous utilisez le harvester. La raison est simple : l’extraction via l’API compresse à la volée l’ensemble des données envoyées, alors que le harvester se contente de renvoyer les fichiers sans l’étape de compression.

Pour résumer, la fonction d’export présente les avantages suivant :

  • plus rapide que le moissonnage document par document lorsque votre connexion Internet n’est pas très rapide (connexion ADSL, par exemple)
  • pas besoin de scripter ou d’automatiser le moissonnage, il suffit de saisir l’URL dans le naviageur

Voici un exemple d’extraction, le plus simple qui soit : api-integ.istex.fr/document?q=brain&extract

Vous trouverez également la documentation correspondante ici.

Comme d’habitude, n’hésitez pas à nous faire part de vos remarques dans les commentaires.