Le logiciel TMG_tagger a été développé durant la phase préparatoire afin de réduire le temps nécessaire au balisage des sources et d’aider les chercheurs, non spécialistes en informatique, à produire, avec une ergonomie maximale et un investissement de temps limité, des documents TEI correspondants à leurs attentes. Ce logiciel, écrit en JAVA 8, permet un balisage semi-automatique des documents par le biais d’algorithmes de recherche et de normalisation et de dictionnaires de personnes, d’œuvres, de lieux et de termes musicaux (10.000 entrées – état mai 2016).
Au stade actuel, TMG_tagger porte sur la microstructure des documents (mots, signes de ponctuation, sauts de page, passages à la ligne). Ses fonctionnalités seront progressivement étendues afin de permettre la création assistée des entêtes TEI (header) et le balisage des structures hiérarchiques supérieures à la phrase.
Une version béta du logiciel est disponible sur demande sous la forme d’une licence CC BY-NC-SA 3.0.
TMG_tagger – fenêtre principale.