Guides de voyage

Le travail sur les guides touristiques peut être divisé en trois catégories : récupération de données, étude de contenu et visualisations. Tous les outils développés sont disponible sur le GitHub du projet via le lien suivant.

Récupération de données

Les notebooks créés permettent :
– de télécharger le texte brut d’un document sur Gallica lorsqu’il est océrisé.
– de télécharger les fichiers jpg d’un document sur Gallica (un fichier jpg = une page).
– de télécharger les images par page en format IIIF issues d’un document sur Gallica.
– d’océriser les documents non-océrisés sur Gallica en utilisant le logiciel de reconnaissance optique de caractères Tesseract.

Étude de contenu

Deux outils ont été créés afin de reconnaître automatiquement les entités nommées (REN) et d’aligner ces entités avec Wikidata pour récupérer des informations sur les personnages identifiés et effectuer des calculs statistiques.

Visualisations

Différents outils ont été développés pour créer des cartographies suivant les lieux référencés dans un document. Les coordonnées géographiques sont récupérées via Wikidata. Les cartes peuvent être interactives avec des tris suivant le type de lieu et présenter un ou deux parcours.