ISTEX-DL se met sur son 4.21 et sort le grand jeu


Plus de 9 mois après la sortie de la version 4.19, que nous vous avions présentée dans un précédent billet de blog, nous avons le plaisir de vous annoncer la disponibilité de la version 4.21 d’ISTEX-DL.

Cette version est l’aboutissement d’une démarche visant à vous offrir une meilleure expérience utilisateur. Cela se traduit par un certain nombre de nouveautés et de modifications, tant sur le plan ergonomique que fonctionnel. Ce billet est l’occasion de vous les détailler.

Nous en profiterons aussi pour vous présenter les améliorations apportées par la version 4.20 publiée le 12 mai dernier.

Pour rappel, ISTEX-DL est disponible à l’adresse https://dl.istex.fr et son code source sur https://github.com/istex/istex-dl.

Les nouvelles fonctionnalités

Concentrons-nous d’abord sur les nouvelles fonctionnalités apportées par cette version.

Des requêtes sans limites

Jusqu’à la version 4.20 d’ISTEX-DL, les requêtes acceptées par l’application étaient limitées en nombre de caractères (pour le mode « recherche booléenne ») ou bien en nombre d’identifiants (pour le mode « recherche par ARK »). Désormais il est possible d’interroger ISTEX, quelle que soit la longueur de sa requête et le nombre d’identifiants demandés. Et cerise sur le gâteau, les téléchargements effectués restent toujours « partageables », même avec des requêtes très longues.

Ceci est rendu possible grâce à un mécanisme qui associe un identifiant de requête « q_id » à la requête longue saisie. C’est cet identifiant qui sera utilisé dans les liens de partage et de téléchargement.

Quelques précisions sur ce « q_id » :

  • Cet identifiant a une durée de vie limitée à 6 mois. Passé ce délai, les liens de partages ne seront plus fonctionnels.
  • Ce délai de 6 mois est remis à zéro à chaque téléchargement.
  • Une même requête produira toujours le même « q_id ». Ainsi, si un identifiant expire, vous pourrez toujours le « ré-activer » à condition d’avoir conservé la requête qui a servi à le générer.

Affichage de l'identifiant de requete q_id dans la barre d'adresse

Une nouvelle manière de cibler les documents

Un nouveau mode de sélection des documents a été ajouté : l’import de fichier. Ce mode de sélection permet d’utiliser des fichiers « .corpus », contenant une liste d’identifiants ARK menant chacun à un document ISTEX.

 

Capture vidéo illustrant l'import de fichiers

Les fichiers « .corpus » utilisés dans l’import de fichiers doivent avoir été préalablement constitués ou récupérés d’un précédent téléchargement effectué via ISTEX-DL. Ils peuvent également être obtenus en moissonnant l’API avec le programme harvest-corpus disponible sur Github.
Des exemples de fichiers « .corpus » peuvent être obtenus sur https://corpus-specialises.corpus.istex.fr, par exemple le jeu de documents du corpus Beethoven (corpus présenté dans un précédent billet).

Un échantillon de résultats

Une autre nouveauté est l’affichage d’un échantillon de résultats correspondant à votre requête ou à votre sélection de documents.
L’interface va ainsi afficher des informations concernant les 6 premiers documents trouvés : titre, auteur, année de publication, etc. Ces résultats sont cliquables, ce qui permet de visionner la version PDF de chacun d’entre eux.

échantillon de résultats

Un nouveau format d’export

Historiquement, nous avons fait le choix de fournir l’ensemble des fichiers téléchargés dans une archive au format Zip, qui est un standard largement répandu et supporté nativement par la majorité des systèmes d’exploitation. Dans certains cas, il peut être préférable d’utiliser d’autres formats que Zip, qui auront des avantages très spécifiques. C’est pourquoi nous vous offrons à présent la possibilité de télécharger des archives au format tar.gz1. Ce format, supporté nativement dans les environnement Unix/Linux, a l’avantage d’offrir de meilleurs taux de compression que Zip et est plus adapté pour de gros volumes de données.

Il est en outre possible de choisir entre 3 niveaux de compression, ce qui permet d’obtenir des archive plus ou moins volumineuses.

choix du format de l'archive

Une ergonomie remaniée

Outre ces nouvelles fonctionnalités, ISTEX-DL a subi de nombreuses retouches au niveau de son apparence et de l’agencement de la page.
Ces changements font suite à une démarche plus globale de refonte de l’application, visant à la rendre plus ergonomique, plus simple d’usage et utilisable en version mobile (« web responsive »).

Déplacement du menu latéral en bas de page

Le premier changement marquant concerne le menu latéral qui contient les boutons « Exemples », « Réinitialiser », « Récupérer », « Partager » et « Historique ».

En dehors du bouton « Exemples », qui se retrouve en haut à droite de la zone de saisie, le reste du menu est déplacé en bas de page, de manière à être visible et utilisable en permanence.

déplacement du menu

De nouveaux noms pour les onglets de l’étape 1

La première étape du formulaire a également été remaniée. Dans cette zone, les boutons « Recherche classique » et « Recherche par ARK » ont été renommés en « Équation booléenne » et « Identifiants ARK ». Vous noterez également l’ajout du bouton « Import de fichier » correspondant à la fonctionnalité présentée plus haut.

Un bouton permettant de sélectionner tous les documents en un seul clic a été ajouté.

Renommage des onglets

 

Une nouvelle étape 2 centrée sur les usages

Pour rappel dans la version 4.19, l’étape 2 permettait de choisir les formats de fichiers souhaités (par exemple : JSON et PDF pour chaque document trouvé). Ce choix, parmi une quinzaine de cases à cocher et de formats potentiellement inconnus, pouvait dérouter plus d’un utilisateur.
Nous avons donc choisi de mettre en place un système permettant de présélectionner ces formats en fonction de l’usage souhaité, d’où le nouveau nom « Usage » de cette étape.

Par exemple, si l’utilisateur choisit l’usage « Lodex », l’archive Zip téléchargée contiendra uniquement le format JSON, accepté par le logiciel Lodex, et pourra être importée telle quelle dans l’outil. La sélection fine des formats de fichiers est toujours possible en choisissant l’usage personnalisé.

Choix des formats par usage

Actuellement seuls les usages « Personnalisé » et « Lodex » sont disponibles, mais nous prévoyons d’ajouter de nouveaux usages, qui permettront d’importer les données obtenues dans d’autres plateformes telles que Cortext ou Gargantex.

Un design pensé pour le mobile

ISTEX-DL sur téléphone et tablette

Dans ses versions précédentes, ISTEX-DL était déjà utilisable sur smartphone ou tablette. Il était tout à fait possible de saisir une requête, choisir le nombre de documents et les formats souhaités et démarrer un téléchargement. Cela pouvait malheureusement s’avérer difficile et fastidieux à cause de quelques limitations d’ergonomie.

Cette nouvelle version 4.21 essaie de corriger ces défauts de différentes manières :

  • Comme indiqué précédemment le menu est à présent constamment affiché et à portée de clic
  • La quasi-totalité des infobulles s’affichent au clic et non plus au survol de la souris
  • La taille et l’agencement des onglets et des boutons a été revue
  • La sélection des formats par usage tend à diminuer le nombre de clics total

Ces nouveautés devraient ainsi faciliter et fluidifier l’utilisation d’ISTEX-DL sur mobile et tablette.

À vous de jouer

Nous espérons donc que cette nouvelle version vous facilitera la vie. N’hésitez pas à nous faire part de vos retours, que ce soit en commentaire ou via la liste users (users @ listes.istex.fr sans espace).

Restez à l’écoute, de futures nouveautés sont prévues dans les prochains mois !

Claude, pour l’équipe ISTEX

 

Notes

1. En réalité le format « tar.gz » est un « double format ». L’archive obtenue est une archive au format « tar », elle-même compressé au format « gzip ».


2 thoughts on “ISTEX-DL se met sur son 4.21 et sort le grand jeu

    • Avatar

      Que de nouveautés ! Chapeau l’équipe.

      J’adore la prévisualisation des résultats, les exports imports avec lodex, le design mobile et aussi le retrait de la limite du nbr de doc téléchargeable en une requête.
      Je me rappelle que c’était compliqué techniquement, finalement c’est le streaming qui a pu être mis en place ?

      Je vous envoi plein de soleil !

      Stéphane

      • Claude NIEDERLENDER

        Merci pour ton commentaire Stéphane !

        Oui c’est ça, le zip est réellement construit à la volée (streaming Node avec gestion du backpressure…)

        On a quand-même fixé une limite à 100 000 docs max, car au-delà ça peut être compliqué pour l’utilisateur (espace disque nécessaire, téléchargement très long sans possibilité de reprise si interruption, etc.). Mais en interne, on a fait des tests de téléchargement dépassant le million de docs.

        On a annoncé cette évolution en début d’année dans ce billet :https://blog.istex.fr/la-nouvelle-version-distex-dl-repousse-les-limites/.

        Cool pour le soleil, effectivement il fait beau ce matin !

        En tous cas, ça fait plaisir de te lire.

        Claude

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *