You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
"description": "Jeu de v\u00e9rit\u00e9s de terrain pour la transcription automatique produit avec eScriptorium dans le cadre du cours HNU2000 \u00e0 l\u2019Universit\u00e9 de Montr\u00e9al au trimestre d'automne 2024. Le jeu de donn\u00e9es contient des pages tir\u00e9es al\u00e9atoirement des num\u00e9risation du \"Journal de C\u00e9lestine Doniau-Danest sur les d\u00e9buts de la Guerre 1914-1918\" mis en ligne par les Archives d\u00e9partementales de la Somme. \n\n*Ground Truth dataset for automatic text recognition created with eScriptorium during the HNU 2000 course at the Universit\u00e9 de Montr\u00e9al during the Fall 2024 semester. The dataset contains pages taken randomly from the digitization of the \"Journal de C\u00e9lestine Doniau-Danest sur les d\u00e9buts de la Guerre 1914-1918\" (Diary of C\u00e9lestine Doniau-Danest on the beginning of the 1914-1918 war), published by the departmental archives of Somme.*",
"transcription-guidelines": "De mani\u00e8re g\u00e9n\u00e9rale, les r\u00e8gles de transcription suivies sont immitatives. \n\n- Mots illisibles: durant la phase de transcription, les mots illisibles ont \u00e9t\u00e9 transcrits par \\[???\\]. Ils ont ensuite \u00e9t\u00e9 r\u00e9solus collectivement.\n- D\u00e9coration du texte: les d\u00e9corations comme le soulignage, etc, n'ont pas fait l'objet d'une transcription distincte du reste du texte.\n- Correction et normalisation: les fautes d'orthographes ont \u00e9t\u00e9 reproduites telles que dans la source, les espacements sont en revanche normalis\u00e9s selon l'usage moderne.\n- Ponctuation: \n - pour la transcription des points (.) et des tirets (-), on a respect\u00e9 le trac\u00e9\ndans la source plut\u00f4t que l'usage attendu car le trac\u00e9 de ces deux signes est tr\u00e8s distinct. \n - les signes de ponctuation double (:;?!) ne sont pas pr\u00e9c\u00e9d\u00e9 d'un espace.",
"title": "DISTINGUO : Ground truth for Handwritten Text Recognition (HTR) on Collections of Distinctions (late 13th to late 15th century) ",
14690
+
"url": "https://nakala.fr/10.34847/nkl.48ad8b8d",
14691
+
"authors": [
14692
+
{
14693
+
"name": "Svetlana",
14694
+
"surname": "Yatsyk",
14695
+
"orcid": "0000-0001-5356-7746",
14696
+
"roles": [
14697
+
"transcriber",
14698
+
"aligner"
14699
+
]
14700
+
}
14701
+
],
14702
+
"institutions": [],
14703
+
"description": "This dataset contains normalized transcriptions of collections of distinctions, specifically \"Summa de abstinentia\" by Nicolas of Biard and \"Dictionarium bovis\" by Thomas of Pavia. They were prepared as part of the DISTINGUO project, dedicated to the study of distinctiones in medieval Latin preaching and led by Marjorie Burghart in 2019-2024.",
"reference": "Yatsyk, S. (2024). DISTINGUO : Ground truth for Handwritten Text Recognition (HTR) on Collections of Distinctions (late 13th to late 15th century) (Version 1) [Data set]. NAKALA - https://nakala.fr (Huma-Num - CNRS).",
0 commit comments