8 juillet 2016 | Team ISTEX | Agile & Scrum , API , Team

Fin du Sprint 37 d’ISTEX-API: « Fed-Ex, après la préparation, la livraison »


Bonjour,

 

Nous avons terminé le sprint #37 « Fed-Ex, après la préparation, la livraison » ce mardi. Voici le Burndown chart et le Reste-à-faire :

bdc37raf37

Les premiers congés estivaux au sein de l’équipe se font sentir, néanmoins, nous avons tout de même été en capacité d’effectuer un certains nombre de réalisation :

  • Passage de l’API v3.9
    • Bugfix sur l’authentification par IP, le bug provenait d’une forte sollicitation de l’API
    • Passage des champs N° de page, issue et volume en « String » dans le mapping elasticsearch (sera effectif lors de la prochaine indexation)
    • Export de sous-corpus (voir ci-dessous)
  • Démonstrateur
    • Distinction entre rankBy et sortBy
    • Tri par le score de de pertinence pondéré par le score de qualité par défaut, seulement sur le démonstrateur (rankBy=qualityOverRelevance)
  • Fédération d’identité
    • Études des différentes briques techniques nécessaire à la mise en place de la fédération d’identité au sein de l’API
  • Export de sous-corpus
    • Permet l’export de données suivant les critères de recherche
    • Export partiel des données selon les formats choisis
    • Export selon les critères de tri et de classement
    • Documentation décrivant la syntaxe et le fonctionnement ici.
  • Travail inter-équipes
    • Réunion de travail sur l’usage des enrichissements avec l’équipe ISTEX-RP
    • Workshop TEI
    • AG DPI
    • Atelier d’échange « API Crossref »
  • Ingestion et Loadistex
    • Intégration du module développé par ISTEX-RD « rd-multicat » chargé de la catégorisation des documents
    • Correction de la TEI, rechargement nécessaire
  • Tests unitaires « corpus-resources »
    • Test de non-régressions des feuilles de transformation utilisé pour la conversion vers MODS et TEI dans la chaîne Loadistex
  • Concerto
    • Fix sur le suppression de session
    • Fix sur le parcours des JSON
    • Amélioration de la fluidité d’affichage
    • Tests Unitaires

 

Quelques chiffres sur l’API (sur 30 jours vs le sprint précédent):

  • Nombre de corpus ingérés : 15
  • Nombre de documents disponibles via l’API : 17 008 331
  • % de disponibilité de l’API sur les 30 derniers jours :
    • 98,23% pour les recherches (vs 99,94%)
    • 96,97% pour l’accès au plein-texte (vs 98,37) (bug sur l’authentification)
  • Nombre de requêtes à l’API les 30 derniers jours : 28,6M
    • ~8% recherches (?q=…)
    • ~55% de plein-texte (PDF, TEI et TXT)
    • ~36% de métadonnées (MODS, XML et JSON)

 

Nous entamons désormais la période estivale et ne feront pas de sprint durant cette période pour cause de manque d’effectif.

Je profites de ce billet pour vous annoncer l’arrivé de Francis Bondo au sein de l’équipe ISTEX-API, désormais composé de :

  • Claude Niederlender (Product Owner)
  • Etienne Caron
  • Jean-Joffrey Parentin
  • Francis Bondo
  • Valérie Previtalli (50%)
  • William Paul, moi même (Scrum Master)

Cependant, l’équipe va subir une nouvelle transformation prochainement puisque je quitte le CNRS après un peu plus de 3 ans et demi au sein du projet ISTEX. Ce fût une expérience enrichissante tant en termes de compétences qu’en termes de relations Humaines. Et je souhaite tout le bien qui lui est dû au projet ISTEX.