A travers le projet D4R, centré sur l'Espagne du XVIe siècle, se dessine une toute nouvelle approche de la recherche en Histoire et de la conservation et la consultation des archives, au croisement des sciences humaines et de l'informatique.
Le projet ANR interdisciplinaire “Dissidences religieuses et Réception de la Réforme à la Renaissance (Espagne–XVIe s.)”, dorénavant D4R, associe deux équipes de l’Université Paul-Valéry : l’EA IRIEC (pilote) et l’UMR PRAXILING à trois autres équipes de l’Eurorégion Pyrénées-Méditerranée ainsi qu'une équipe de l'Université de Tolède, Espagne.
D4R poursuit un double objectif en Humanités numériques : d'une part, le traitement et l’éditorialisation d’un corpus du XVIe s. sur la Réforme en Espagne et, d'autre part, la mise au point d’un outil pour interroger d’importantes masses documentaires, dans une perspective historique, avec des prolongements possibles sur les plans littéraire et philologique.
La ressource numérique qui en naîtra entend devenir tout à la fois un auxiliaire des chercheurs à l’heure d’exploiter des corpus textuels hétérogènes en histoire, en disposant d’outils d’annotation et d’interrogation de grandes masses documentaires, et un outil de valorisation du patrimoine historique à l’attention du grand public. En effet, l’ANR D4R, qui réunit une équipe de près de vingt historiens, hispanistes, linguistes et informaticiens français et espagnols, vise à rendre possible l’exploration dynamique d'un corpus documentaire par le biais d’une plate-forme numérique. Celle-ci, en mettant à disposition un algorithme et une ontologie évolutive, offrira une aide semi-automatique au traitement de données parcellaires et de sources documentaires hétérogènes.
Un traitement innovant des sources anciennes
En amont, un fonds de 25 ouvrages anciens sur la Réforme est soumis à un traitement innovant d’OCRisation adapté à l’imprimé du XVIe s. au moyen de solutions d’intelligence artificielle. Les corpus de textes couplés aux transcriptions d’archives sont ensuite soumis à une chaîne de traitement linguistique performante afin d’améliorer au mieux tant le traitement semi-automatisé du corpus que le requêtage. Car l’ANR D4R se propose ensuite d’explorer une approche innovante des sources en s’appuyant sur une plate-forme informatisée : celle-ci verra se mettre en œuvre une méthodologie ascendante où l’humain et l’algorithme vont construire collaborativement, itérativement et interactivement une nouvelle ontologie du domaine d’intérêt et/ou de la question étudiée.
Ce projet ANR entend tout à la fois préserver, diffuser et valoriser un corpus historique lié à un pan polémique de l’Histoire et de la mémoire espagnoles (la réception de la Réforme en terre d’Inquisition) mais vise aussi à mettre au point un outil ayant vocation à être développé à l’intersection de plusieurs langues dans un projet ultérieur. Il finance notamment le contrat d’un doctorant en Humanités numériques, Huma-Num, d’un post-doc en informatique et traitement de l’information et d’un ingénieur informaticien.
Débuté en février 2022, il se déroulera au cours de quatre années.
Un partenariat international et interdisciplinaire
L’ANR D4R réunit un consortium de plusieurs partenaires : l'IRIEC (Institut de recherche intersite en études culturelles) et PRAXILING (Université Paul-Valéry), l'IRIT (Institut de recherche en informatique de Toulouse) de l'Université fédérale Toulouse-Midi-Pyrénées, le GRIAL (Grup de Recerca Interuniversitari en Aplicacions Lingüístiques) de l'Université de Barcelone, l’UHM (Université Autonome de Barcelone) et le DeReHis (De Re Hispanica) de l'Université de Castille-La Manche, Tolède.