Océrisation du corpus Nature

Classé dans : Actualite, Divers, ISTEX-DATA | 0

 

L’équipe ISTEX-DATA a le plaisir de vous annoncer l’océrisation de 329 744 documents pour le corpus Nature, soit l’équivalent de plus de 600 000 pages.
Cette océrisation concerne les PDF dépourvu de texte et permet de proposer des fichiers TXT (fulltext/ocr) pour tout le corpus Nature disponibles dans le démonstrateur avec l’icône suivante :


D’autres corpus seront océrisés dans les semaines à venir, nous publierons un autre billet prochainement pour vous donner des informations plus détaillées.