-
Notifications
You must be signed in to change notification settings - Fork 6
/
corpus_status
executable file
·61 lines (49 loc) · 1.47 KB
/
corpus_status
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
#Informations à reverser dans les fichiers XML directement.
ed_FloovG
numérisation: finie
annotation: finie
ed_GuiBourgG
numérisation: finie
annotation: finie
ed_OtinG
numérisation: finie
annotation: en cours
transcr_Asprem_C
transcription: à finir
étiquetage: relu 2 fois pour la partie transcrite
vérifications
automatique: oui
par paradigme: non
transcr_Asprem_P4
transcription: finie; relue une fois
étiquetage: relu 2 fois - à vérifier
balisage courant
discours direct: fait
noms propres: repérage fait
transcr_Fier_V
transcription: à finir (OCR à entraîner)
étiquetage: relu 1 fois
Loherains:
ed_GarLorrBa
ed_GarLorrBe1
ed_GarLorrBe2
ed_GarLorrC
ed_GarLorrMe1a
ed_GarLorrMe1b
ed_GarLorrMe2
ed_GarLorrMo
ed_GarLorrPa
ed_GerbMetzMe1
ed_GerbMetzMe2
ed_HervisP
-> relu une fois; vérifications systématiques faites, et modifiées directement dans l'XML. Fichiers du dossier tag regénérés à partir de l'XML et non modifiés (20190502).
Fragms:
relu une fois, vérifications systématiques non faites; étiquetage intégré directement.
ed_FlorenceA
ed_GarLorrDr
ed_GirVianeM
ed_MacaireAl2B
ed_MacaireAl3T
TODO: supprimer corpus Loherains sur Pyrrha, corriger (et supprimer?) corpus Fragms.
Harmonisations / vérifications à faire:
- vaillant valoir VERppa vs vaillant ADJqua