IReMus, 2 rue de Louvois, 75002 Paris, salle de réunion, 1er étage
Cet atelier-séminaire dresse un premier état des lieux du travail éditorial en cours dans le projet TMG. Il se concentre sur les enjeux de l'édition des parties textuelles de quatre sources sélectionnées : Anonymus Exerpta (c. 1496), Cochlaeus (1507), Wollick (1509) et Virdung (1511). Les interventions de la journée reviendront sur les formats d'encodage retenus et sur la manière spécifique dont les directives de la Text Encoding Initiative (TEI P5) sont appliquées dans TMG. Seront présentés les outils informatiques développés afin de permettre un balisage semi-automatique suite à une phase d'apprentissage. Cette journée donnera également l'occasion de revenir sur les différentes solutions envisagées pour la consultation en ligne des éditions. À cette fin, les interventions reviendront sur la plateforme XTF et la manière dont cette dernière a été modifiée pour les besoins spécifiques du projet. Enfin, la présentation des résultats obtenus au cours de ce premier mois de travail permettra de revenir sur les défis techniques, mais aussi philologiques et linguistiques, que posent l'édition électronique des sources retenues. Pour le bon déroulement de la journée, merci de bien vouloir confirmer votre venue avant le 2 novembre.
9h30 Introduction générale au séminaire-atelier
9h45 Christophe Guillotel-Nothmann, L'Application de la Text Encoding Initiative (TEI P5) dans le projet Thesaurus Musicarum Germanicarum
La Text Encoding Initiative – schéma XML de description des textes – comporte plus de 500 éléments dans sa version actuelle (P.5). Ce nombre élevé, lié à la nécessaire polyvalence d'un format adapté au large spectre des sciences humaines, entraîne une complexité difficilement maîtrisable au quotidien de la pratique éditoriale. Pour cette raison, un sous-ensemble de directives, spécifiquement adaptées au corpus, est en cours d'identification et d'intégration dans un référentiel propre au projet. Après une brève présentation générale du format TEI, la communication reviendra sur la manière dont la plateforme informatique XTF a été adaptée aux besoins du projet. Puis sera présentée, à partir d'exemples extraits des travaux éditoriaux en cours, la manière spécifique dont la TEI est utilisée. L'intervention montrera comment l'encodage XML est mis à profit pour résoudre les problèmes philologiques rencontrés dans le corpus. Il s'agira aussi de revenir sur les avantages du format pour l'identification des rapports intertextuels, la mise en évidence des interventions éditoriales et le travail sur la terminologie musicale. Enfin, seront discutés les cas problématiques pour lesquels des solutions à la fois techniques et méthodologiques doivent encore être précisées.
10h15 Pauline Spychala, La Musica (1507) de Johannes Cochlaeus : quelques enjeux philologiques de son édition électronique
La Musica (1507) de Cochlaeus permet de cerner certains enjeux philologiques et techniques que présentent les premières sources imprimées de théorie musicale appartenant à la sphère germanique. La question de l'encodage des variantes typographiques et des abréviations sera abordée avec les solutions qui ont été choisies pour palier à ces difficultés particulièrement marquées dans les sources latines de la période concernée. Le traitement de la ponctuation entraîne des modifications sémantiques et des choix philologiques importants qu'il convient également de clarifier. En définitive, l'étude du sens et de la structure du texte apparaît comme une étape indispensable au travail éditorial engagé.
10h45 Café
11h00 Anaëlle Le Royer, Édition de sources en haut-allemand précoce : la Musica getutscht (1511) de Sebastian Virdung
L'amorce de l'édition numérique de la Musica getutscht (1511) de Sebastian Virdung fait état de problématiques propres à l'édition de textes rédigés en nouveau haut-allemand précoce (entre 1350 et 1650). Les occurrences problématiques déjà rencontrées au niveau de l'édition des premiers chapitres devront permettre d'établir des règles de traitement qui guideront l'édition de l'ensemble du traité. Ces questions se situant principalement à un niveau syntaxique et/ou morphologique, une attention particulière doit être portée aux enjeux linguistiques de cette édition, dont les choix de traitement impliquent un questionnement méthodologique : jusqu'à quel point la normalisation, notamment orthographique, est-elle pertinente ; comment distinguer les erreurs d'impression de ce qui relève de l'oralité ; où placer la limite entre confort de lecture et fidélité au manuscrit, dans le traitement des majuscules par exemple ? Ces questionnements trouvent leur écho dans la gestion technique de ces choix philologiques.
11h30 Adrien Tannhof, L'édition numérique de l'Exerpta Musica (Anonyme, c. 1496) : enjeux de l'intertextualité
Outre les difficultés inhérentes à l'identification du texte, l'édition numérique du traité anonyme Exerpta Musica (c. 1496) se voit confrontée à l'identification des références implicites et explicites qui émaillent l'ensemble du texte. Les nombreux emprunts souvent implicites, notamment à Boèce mais aussi, dans un rapport plus immédiat, à Adam de Fulda, font de ces sources des sous-textes importants que le traité anonyme partage avec d'autres écrits contemporains appartenant à l'École de Cologne. L'enjeu devant une citation ou la découverte d'une reprise ultérieure est d'identifier précisément la source (commune le cas échéant) et d'établir des catégories pertinentes afin de représenter le plus visiblement possible ce phénomène large de l'intertexualité qui n'adopte pas les mêmes expressions qu'aujourd'hui. Cette approche permettra de dessiner la cartographie des références qui circulent au sein de cette sphère intellectuelle et géographique. Le croisement des différents "intertextes" permettra également de résoudre certains problèmes d'identification et de clarifier des choix éditoriaux.
12h00 Déjeuner
14h00 Florence Le Priol, Outil semi-automatique d’aide au balisage de texte
Pour aider au balisage des textes du projet TMG, un outil semi-automatique d’aide au balisage a été réalisé dans une première version. Cette maquette, opérationnelle pour une partie des tâches à effectuer, sera la base pour établir une version plus complète. En effet, elle va permettre de préciser les spécifications et de tenir compte des premiers retours d’expérience. Nous présenterons les fonctionnalités de cet outil au stade actuel de son développement et discuterons des améliorations déjà envisagées. Cet outil est réalisé avec le langage Python, nous reviendrons également sur les éléments qui ont conduit à ce choix.
14h30 Christophe Guillotel-Nothmann, TMG_tagger : carnet de bord pour la conception d'un logiciel d'édition TEI
La phase de lancement de TMG a permis de mieux cerner les besoins informatiques spécifiques au balisage semi-automatique des sources constitutives du corpus. Aux fonctionnalités imaginées au préalable (dictionnaire de balise, apprentissage assisté du logiciel etc.), sont venues s'ajouter d'autres nécessités auxquelles il a fallu répondre au fil de l'avancement des travaux d'édition : balisage individuel des occurrences identiques, détection des unités à baliser, génération automatique de balises, fonctionnalités de recherche. Le logiciel TMG_tagger, écrit en java, a été développé en lien étroit avec le projet durant son premier mois de lancement. Il se conçoit comme un carnet de bord dont les expériences pourront être mises à profit lors de la conception d'un outil définitif. À partir d'un court extrait à éditer, la présente intervention reviendra sur le fonctionnement général du logiciel et sur les formats d'encodage utilisés. Elle présentera les différentes routines implémentées. Enfin, seront identifiées les fonctionnalités non encore disponibles qui pourraient cependant s'avérer utiles pour les tâches éditoriales à effectuer.