Cluster 5b – ÉquipEx+ Biblissima+

Élaboration d’un laboratoire d’édition et d’annotation de sources

Coordination : Stéphane Lecouteux (MRSH/PDN), avec Emmanuelle Kuhry (IRHT) et Marie-Luce Demonet (CESR).

En partenariat technique avec le CERTIC (DSI, Unicaen).



Dans la continuité des travaux menés par Biblissima pour l’édition ou l’annotation en ligne et en libre accès de corpus textuels (exemple Thecae), le pôle Document numérique propose de concevoir un laboratoire qui ne sera pas une plateforme de publication, mais un espace d’expérimentation pour la recherche par la recherche.

L’environnement en XML-TEI offrira un espace de travail et d’expérimentation collectif et collaboratif, à la fois technique et scientifique, pour des éditeurs et annotateurs scientifiques de sources anciennes.

Le laboratoire permettra, selon des modalités variées, de consulter les sources dans un portail en ligne ainsi que de modifier et d’enrichir progressivement le travail produit (work in progress).

Les travaux du cluster 5b visent les objectifs suivants :

  • les éditeurs scientifiques de sources traitant de genres textuels extrêmement diverses, sur une période étendue – du Moyen Âge à la Renaissance– un travail particulier de mutualisation des schémas d’encodage en XML-TEI sera entrepris. On aboutira dans l’idéal à un schéma unique commun modulable ;
  • la construction d’outils d’encodage XML-TEI accompagnés de leur documentation et faciles d’utilisation ;
  • un portail de mise en ligne, reposant sur le moteur d’affichage MaX, développé dans le cadre de Biblissima, et permettant :
    • d’accéder aux corpus de recherche selon différentes modalités ;
    • de construire des outils d’interrogation et de consultation communs : visualisation de données, consultation de flux parallèles ; graphes ; multiflux de notes ; moteurs de recherches complexes, etc.

Dans le cadre de ce cluster, le PDN assurera une formation à l’édition numérique en TEI sous formes de séminaires, écoles d’été, ateliers, en collaboration avec le CRAHAM ou le CESR de Tours.

Les travaux en cours (2024-2025) suivent trois axes :

  • une approche segmentaire des textes intégrant la norme DTS qui permet l’accès à des textes numériques segmentés (extraction de passages/ fragments de texte). Ces travaux sont réalisés en étroite collaboration avec le cluster 7 ;
  • la création d’un thesaurus à partir du travail sur les typologies textuelles entrepris par le consortium CAHIER/ ARIANE. L’objectif de cette sous-tâche est de faire évoluer ce thesaurus pour répondre aux besoins de Biblissima+ (cluster 5b, portail, etc.) ;
  • des ateliers de travail modulaires autour de différents types de sources alimentent les expérimentations sur la segmentation textuelle et sur l’enrichissement du thesaurus avec la qualification des segments manipulés : apparat critique (ateliers en cours depuis 2022), liturgie (ateliers en cours depuis 2022), gloses (ateliers en cours depuis 2022), glossaire (ateliers en cours depuis 2023), sources annalistiques (ateliers démarrés en 2024).