Skip to content

Latest commit

 

History

History
142 lines (110 loc) · 6.94 KB

crCahier2015-07-01.md

File metadata and controls

142 lines (110 loc) · 6.94 KB
date tags
2015-07-01
cr, tei, corpus, édition critique

cr Consortium Cahier 1er juillet 2015

Projet Stendhal

Data based but not databased...

Stendhal c. 2005 Ne pas voir les balises Morphon XML editor, WYSIWYG avec gestion d’une structure arborescence

site inauguré novembre 2009

9 ans = un bilan 130 000 euros, 2 stages et 1 post-doc 36 séminaires, 3 financements de thèses 2921 pages en ligne 7000h de vacations 288h CTR 1 délégation CNRS

Pierre-Yves

Recherche et patrimoine écrit Pb statut du document, et manière dont il a été constitué une source écrire = un ensemble de données variées

Fragment, unité, pages qui deviennent une unité. En tant qu’éditeur matériel, trouver des solutions communes qui permettent de répondre aux besoins divers des chercheurs.

Convergence numérique aujourd’hui achevé. Le numérique a complètement submergé la chaîne de travail. Le jeu pour l’éditeur matériel de s’insérer dans un processus d’édition qui va lui permettre de travailler à partir d’une seule source pour produire les différents formats. Documents matériels, formats numériques, solutions pour archivage à long terme

respect des métiers

  • Archiviste conservateur produit des solutions d’accès identifie sources, décrire le contenu organiser l’accès
  • éditeur scientifique qui va lui proposer une édition réorganiser ensemble éléments, etc.
  • éditeur matériel Produire édition rendre possible la citation

Trois métiers qui peuvent travailler les uns avec les autres. Des acteurs qui ont des métiers, des cultures particulières à prendre en compte dans l’édition.

Structuration et respect des standards TEI, ONIX, EAD, etc.

Même si pour une communauté donnée l’appropriation d’un vocabulaire est une tâche longue. Peut très bien produire une conversion.

Objectifs du pôle Articuler la valorisation du patrimoine manuscrit et la recherche scientifique sur ces sources.

Considérer les objets qui portent les textes comme des ensembles d’informations fragmentables et articulables entre eux.

Travail qui se fait dans le cadre d’un laboratoire de textes Correspond aux centres de DH Banc d’essai de chimistes.

Principes Flux et fragments de textes S’intéresse ici au texte non pas à sa représentation. Extraction contenu, pourrait préciser les relations sur le texte qui précède qui le suit. L’intérêt c’est que va pouvoir réitérer l’opération autant que de besoin pour chaque fragment. À partir de ces fragments transcrits et encodés, va pouvoir produire l’édition numérique par exemple.

Distingue deux niveaux de discours sur les sources. Balisage éditorial suffisant pour l’édition : versification, titres, paragraphes, etc. Peu de profondeur

Balisage scientifique Balisage plus précis, structures complexes, segments, indications bibliographqiues, plusieurs types de notes. Structure aussi profonde que possible. Éditeur qui va devoir ramener le discours à quelque chose d’éditorial.

Éditions multi-modales Multiplie les accès aux textes. Peu avoir plusieurs solutions de lecture pour un seul support. Articulation de plusieurs supports et de plusieurs solutions d’accès aux textes (sélection de textes en fonctions des supports, multiplication des parcours de lecture.) Dans tous les cas, prendre soin de la stabilité des formes d’édition. Pour la disputation universitaire, on a besoin de la citation.

Logique du Single Source Publishing Il s’agit de multiplier les formes de diffusion à partir d’un seul fichier Cf. schéma du Chicago manual of style. Un fichier central à partir duquel va produire toutes les formes de diffusion numérique. Il s’agit d’adapter cette chaîne là, pour que chacun y trouve sa place de manière à ce que la collaboration soit le moins dysphorique possible.

Méthodes : traitement de texte Transformation à partir de OpenOffice. Avec un document stylé, étiquettage qui permet de s’en sortir dans bien des cas. Export XML, versement dans des portails de diffusion, etc. Passe d’un vocabulaire XML, celui d’Open Office à un vocabulaire métier qui est celui de la TEI.

Méthodes : Edition XML Réduction du niveau d’encodage. Bien sûr il s’agit de travailler avec des arbres XML. Présentation particulière :

  • sérialisation XML : du texte avec une coloration syntaxique (produire par l’éditeur qui est capables de repérer des séquences de caractères) Cette représentation sert seulement à l’humain pour travailler sur ces fichiers pour les manipuler. Singe la représentation machine.
  • quand travaille pour l’édition ne sert à rien d’avoir des balises. Éditeur XML qui va permettre de travailler avec des balises. On doit donc collectivement être en mesure d’organiser le travail, en respectant les métiers, de manière à ce que les éditeurs puissent relire correctement le document, le chercheur puisse produire le document dans une interface confortable. Aucune raison de fermer ces fenêtres là car pas de verrou technique. Un enjeu ergonomique central pour lequel doit pouvoir travailler collectivement pour trouver des solutions.

Méthodes : Formes de diffusion Tout automatique Seules interventions humaines esthétiques. Intégrer le mouvement, les contraintes liées aux affichages différents sur les différents possibles. Cas le plus difficile contraindre le texte dans une page papier. Nécessite toujours des interventions au moins de vérification, soit ajustement manuel. Tout part du même fichier.

Construction de parcours de lecture. Aucun manuscrit ne propose l’intégralité de la collection. Les chercheurs ont donc produits des parcours particuliers qui vont servir de plan aux éditions.

PAO Historiquement ce qui est le plus compliqué à faire. Travail avec inDesign. Importation XML avec différents niveaux d’importation. Seule fonctionnalité avancée, son propre espace de nom qui permet d’associer un élément du flux à un nœud. Exploiter la structure XML pour automatiser tout ce que l’on peut automatiser. Des choses que peut automatiser, d’autres auxquelles on a renoncé. Mais tout ce qu’on peut automatiser et qui va faciliter le travail des secrétaires de rédaction, va le mettre en place.

Méthodes Séparation des flux + réduction du niveau d’encodage Création d’une unité qui correspond à un niveau éditorial et que va pouvoir manipuler dans le logiciel de PAO. Extractions qui sont réalisées au moyen de transformations XSLT.

Flux liés les uns aux autres. Flux français, latin, idem pour les notes. Chaque fois que l’on a un niveau de discours particulier, en produit un flux et va ensuite les manipuler pour les placer automatiquement dans les pages. Synchronisation des flux qui se fait pour le moment encore manuellement.

Discussion

Ne pas trop s’approcher de l’indentation car si XML stabilisé depuis 98, pas forcément ce qui va durer. TGIR Huma-Num chaîne de perrenisation Ce qui les intéresse formes de lecture scientifique et d’annotation.