ISTEX API v2.1.1 en ligne


Chers utilisateurs, vous l’aurez sans doute constaté, api.istex.fr est à nouveau disponible depuis plusieurs jours.

Nous avons profité du tumulte de ces dernières semaines pour passer l’API en version 2.1.1, version qui apporte son lot de nouveautés :

  • amélioration des temps de réponse
  • mise à disposition du corpus Wiley (4,6 millions de documents)
  • ajout d’informations sur les temps de calcul, via le paramètres « stats » (ex de requête)
  • renommage dans la réponse du champ « type » en « extension », pour éviter la confusion avec « mimetype »

Nous travaillons également activement à stabiliser l’API et à limiter les indisponibilités.

D’autres nouveautés sont dans les cartons, nous communiquerons au fur et à mesure de leur mise en place.

Toute l’équipe remercie les beta-testeurs et utilisateurs sans qui notre travail n’aurait aucun sens.


 

api-stats

Statistiques sur la répartition des temps de calcul (moteur de recherche vs api elle-même)

api-extension

distinction « mimetype » vs « extension » (auparavant « type » tout court)


2 thoughts on “ISTEX API v2.1.1 en ligne

    • Bonjour,

      Les temps de réponses ont en effet nettement diminués !

      Concernant les données ramenées par le param &stats
      « stats »: {
      « elasticsearch »: {
      « took »: 224,
      « timed_out »: false,
      « _shards »: {
      « total »: 35,
      « successful »: 35,
      « failed »: 0
      },
      « total »: 4654374,
      « max_score »: 1.4142128
      },
      « istex-rp »: {
      « took »: 5
      }
      Pourriez-vous donner quelques explication sur la façon de les comprendre ?

      Cordialement

    • Claude NIEDERLENDER

      Bonjour,

      Nous avons un découpage en 2 parties :
      – « elasticsearch » pour le moteur de recherche.
      – « istex-rp » pour la partie logicielle de l’API (codée en NodeJS)

      Pour chacune des 2, « took » représente le temps de traitement en ms. Si l’on additionne les 2, on obtient le temps de traitement total. Attention, ces temps n’incluent pas les temps réseau. Il s’agit uniquement de temps de calcul

      Les sous-champs spécifiques à Elasticsearch sont :
      – « time_out » : la requête a-t-elle répondu dans le délai maximum ?
      – « _shards » : notion propre au moteur. Un index est découpé en shards.
      – « total » (4654374) : nombre de documents correspondant à la recherche
      – « max_score » : score de pertinence du premier résultat

Comments are closed.