Princip projektu
Projekt digitalizace Díla Jana Amose Komenského byl zahájen za finanční pomoci Grantové agentury ČR v roce 2002. Jeho podstatou je zpřístupnit v digitální podobě Komenského práce, vydávané od roku 1969 v ediční řadě Dílo Jana Amose Komenského – J. A. Comenii Opera omnia. Tyto texty, kvalitně připravené řadou prvotřídních odborníků v jazycích originálu, budou tím pádem připravené jak pro studium, tak i pro další ediční či jinou publikační práci.
Podstatnou částí projektu není samozřejmě jen reprodukce textů, ale i možnost pokročilých operací, umožněných digitalizací. Prosté texty jsou upraveny do podoby jazyka XML a tak připraveny pro vyhledávací operace. Pomocí nich bude možné celé dílo Komenského třídit na základě jazykových, časových, místních či jiných kritérii vztahujících se k době vzniku textu, stejně jako na základě kritérií vyplývajících z edice: podle zařazení textů v jednotlivých svazcích, podle jmen editorů apod.
Postup prací
Každý svazek byl naskenován pomocí skeneru A3 (Fujitsu M3096GX)a strojově rozpoznán pomocí programu OCR FineReader. Tento surový a mnoha chybami protkaný text byl zadán externím redaktorům, rekrutujícím se vesměs z řad studentů Pedagogické fakulty Univerzity Karlovy v Praze. Ti měli za úkol provést znakovou korekturu celého textu a upravit původní rozložení stránky do kontinuálního textu za pomoci strukturních značek (paginace originálu a paginace edice, marginálie). Pokročilým stadiem úprav bylo doplnění strukturních značek vyznačujících příznakové jazyky. U každého textu byl stanoven bezpříznakový jazyk, tedy ten, ve kterém bylo dílo napsáno, ostatní jazyky objevující se v textu jsou chápány jako příznakové – takové jsou latinské, německé, řecké či jiné vsuvky v českém textu, naopak české či jiné v latinském atd. z tohoto principu byly vyčleněny názvy děl. Tato volba umožní vyhledávání a prohledávání jednotlivých jazykových pasáží i různé pokročilé jazykovědné práce.
Po redakčním zpracování probíhala druhá korektura, tentokrát odstavcová, během níž byl text zrevidován po stránce formální, vyřešeny rozmanité problémy týkající se specifik různých druhů Komenského přístupu (logické stromy, vsazené obrázky, tabulky, časomíra atd.), doplněna hlavička, jednoznačně definující dokument (zkrácený název práce; bezpříznakový jazyk; datum vzniku; typ dokumentu jako rukopis, opis, tisk; příslušný svazek DJAK, pořadí dokumentu ve svazku DJAK, rozsah stran v DJAK, datum vydání, jména editorů). Poslední prací je převádění textového dokumentu do surového formátu XML pomocí volně šiřitelného programu OOWriter sady Open Office.
Text je nakonec posílán spolupracovníkovi Mgr. Pavlu Rychlému, PhD. na Fakultu informatiky Masarykovy univerzity v Brně, jehož úkolem je vytvořit výslednou textovou databázi: naprogramovat postup převádení surového XML do pokročile strukturovaného formátu XML a vytvořit uživatelské prostředí. Nároky na tyto práce jsou značné, protože jde o zpracování kritické edice a jedním z požadavků je zachování vazeb mezi textem a aparátem,a to jak jazykově kritickým, tak i věcným. Zadání požaduje možnost práce jak s textem a aparátem, tak i jen s textem i jen s aparátem.
v současné době je většina textů (podrobnosti viz připojený "přehled zpracovaných textů") ve stavu zkorigovaného textu, vybaveného strukturními značkami a hlavičkami. Značné zpoždění bohužel způsobuje spolupráce s externími pracovníky brněnské univerzity, kvůli níž převod do finálního tvaru v jazyce XML a vybudování textové databáze zaostává za původním časovým plánem dokonce o několik pololetí.
Výstup projektu bude k dispozici ve zkušebním provozu na lokálních počítačích na pracovišti v budově ústavu v Jilské ulici 1 v Praze 1, po ověření funkčnosti bude práce uveřejněna v síti internet.
Přehled zpracovaných textů
První sloupec "svazek" značí číslo rozpoznávaného svazku, "název" jméno pasáže, "rozsah" rozsah stran v edici DJAK, "redakce" značí práci provedenou externími redaktory, "korektura" značí finální text po všech úpravách.
svazek |
název |
rozsah |
redakce |
korektura |
1 |
Předmluva |
7–11 |
ano |
ano |
1 |
Epistula ad Montanum |
12–56 |
ano |
ano |
1 |
Problemata miscellanea |
57–69 |
ano |
ano |
1 |
Sylloge quaestionum controversarum |
71–94 |
ano |
ano |
1 |
Theatrum universitatis rerum |
95–181 |
ano |
ano |
1 |
Amphiteatrum universitatis rerum |
183–200 |
ano |
ano |
1 |
O vycházení a zapadání ... hvězd |
201–218 |
ano |
ano |
1 |
Mapa Moravy |
219–266 |
ano |
ano |
1 |
Moudrost starých Čechů |
267–389 |
ano |
ano |
1 |
zkratky |
ano |
ano |
|
1 |
rejstřík |
ano |
ano |
|
2 |
Retuňk proti Antikristu |
7–288 |
ano |
ano |
2 |
Haggaeus redivivus |
289–398 |
ano |
ano |
2 |
zkratky |
ano |
ano |
|
2 |
rejstřík |
ano |
ano |
|
3 |
Předmluva |
7–15 |
ano |
ne |
3 |
Truchlivý I–IV |
17–160 |
ano |
ne |
3 |
Listové do nebe |
161–184 |
ano |
ano |
3 |
Přemyšlování o dokonalosti křesťanské |
185–233 |
ano |
ano |
3 |
Nedobytedlný hrad |
235–263 |
ano |
ano |
3 |
Labyrint světa |
265–412 |
ano |
ano |
3 |
Pres Boží |
413–426 |
ano |
ano |
3 |
O sirobě |
427–472 |
ano |
ano |
3 |
Centrum securitatis a Renuntiatio mundi |
473–564 |
ano |
ano |
3 |
Bazuine des genaden jaar |
565–589 |
ano |
ano |
3 |
Kšaft umírající matky |
591–614 |
ano |
ano |
3 |
zkratky |
ano |
ano |
|
3 |
rejstřík |
ano |
ano |
|
4 |
Předmluva |
7 |
ano |
ne |
4 |
Naučení o kazatelství |
9–120 |
ano |
ano |
4 |
Veršované skladby |
121–154 |
ano |
ano |
4 |
O poezi české |
155–170 |
ano |
ano |
4 |
Catonis disticha |
171–212 |
ano |
ano |
4 |
Žalmy |
213–290 |
ano |
ano |
4 |
Nové písně některé |
291–330 |
ano |
ano |
4 |
Žehnání kněze Jana Cyrilla |
331–342 |
ano |
ano |
4 |
Písnička ku pohřbu Pavla Fabricia |
343–351 |
ano |
ano |
4 |
Veršované modlitby z přídavků k Praxis pietatis |
353–370 |
ano |
ano |
4 |
Písně a kratší básnické projevy |
371–381 |
ano |
ano |
4 |
De metris Bohemicis ..., Parafráze IV. eklogy |
383–393 |
ano |
ano |
4 |
Carmina per occasionem scripta |
395–423 |
ano |
ano |
4 |
zkratky |
ano |
ano |
|
4 |
rejstřík |
ano |
ano |
|
9/I |
Pojetí dějin v díle J. A. Komenského |
7–22 |
ano |
ano |
9/I |
Historia profana |
23–47 |
ano |
ano |
9/1 |
Historia persecutionum |
dtto |
ano |
ano |
9/I |
Historia o těžkých protivenstvích |
49–442 |
ano |
ano |
9/I |
zkratky |
ano |
ano |
|
9/I |
rejstřík |
ano |
ano |
|
11 |
Rané didaktické spisy J. A. Komenského |
7–12 |
ano |
ano |
11 |
Paradisus ecclesiae, Ráj církve |
13–32 |
ano |
ano |
11 |
Didaktika |
33–221 |
ano |
ne |
11 |
Informatorium školy mateřské |
223–275 |
ano |
ano |
11 |
Informatorium maternum |
277–345 |
ano |
ano |
11 |
Navržení krátké o obnovení škol |
347–358 |
ano |
ano |
11 |
Dvéře jazyků odevřené |
359–435 |
ano |
ano |
11 |
Diogenes cynicus redivivus |
437–500 |
ano |
ne |
11 |
Abrahamus patriarcha |
501–539 |
ano |
ne |
11 |
zkratky |
ano |
ano |
|
11 |
rejstřík |
ano |
ano |
|
12 |
Geometria |
9–39 |
ano |
ano |
12 |
Cosmographiae compendium |
41–68 |
ano |
ano |
12 |
Physicae synopsis, ad physicam addenda |
69–264 |
ano |
ano |
12 |
Disquisitiones de caloris et frigoris natura |
265–292 |
ano |
ano |
12 |
Cartesius a mechanicus everus |
293–308 |
ano |
ano |
12 |
De motu perpetuo scriptorum reliquiae |
309–386 |
ano |
ne |
12 |
zkratky |
ano |
ano |
|
12 |
rejstřík |
ano |
ano |
|
13 |
Sermo secretus Nathanis ad Davidem |
9–34 |
ano |
ano |
13 |
Gentis felicitas |
35–66 |
ano |
ano |
13 |
Panegyricus Carolo Gustavus |
67–94 |
ano |
ano |
13 |
Letzte posaun über Deutschland |
95–154 |
ano |
ano |
13 |
Syllogismus orbis terrarum practicus |
155–174 |
ano |
ano |
13 |
Angelus pacis |
175–211 |
ano |
ano |
13 |
Faber fortunae |
213–265 |
ano |
ano |
13 |
Regulae vitae |
267–284 |
ano |
ano |
13 |
Fortii Erasmique libellis praemissa |
285–292 |
ano |
ano |
13 |
Appendix Vestibuli |
293–311 |
ano |
ano |
13 |
zkratky |
ano |
ano |
|
13 |
rejstřík |
ano |
ano |
|
14 |
Janua rerum sive Totius pansophiae seminarium |
9–48 |
ano |
ano |
14 |
Pansophiae Christianae liber III |
49–107 |
ano |
ano |
14 |
Ad amicos Lesnae in Polonia agentes |
109–116 |
ano |
ano |
14 |
Consultationis brevissima delineatio |
117–126 |
ano |
ano |
14 |
Elaborandorum operum catalogus |
127–136 |
ano |
ano |
14 |
Studii pansophici in Anglia fautoribus |
137–150 |
ano |
ano |
14 |
Janua rerum reserata (zlomek) |
151–168 |
ano |
ano |
14 |
Pansophiae diatyposis, Templi pansophici delineatio scenographica, Scenographiae pansophicae pars II |
169–278 |
ano |
ne |
14 |
Via lucis |
279–385 |
ano |
ne |
14 |
zkratky |
ano |
ano |
|
14 |
rejstřík |
ano |
ano |
|
15/I |
Dedicatio |
ano |
ne |
|
15/I |
Praefatio ODO |
ano |
ne |
|
15/I |
Praefatio ODO I |
ano |
ne |
|
15/I |
Didactica magna |
ano |
ne |
|
15/I |
Schola infantiae |
ano |
ne |
|
15/I |
Schola vernaculae delineatio |
ano |
ne |
|
15/I |
Janua lingvarum |
ano |
ne |
|
15/I |
Januae lingvarum vestibulum |
ano |
ne |
|
15/I |
De astruendo Januae templo |
ano |
ne |
|
15/I |
Didactica dissertatio |
ano |
ne |
|
15/I |
zkratky |
ano |
ano |
|
15/I |
rejstřík |
ano |
ano |
|
15/II |
Pansophiae preludium |
8–53 |
ano |
ne |
15/II |
Conatuum pansophicorum dilucidatio |
57–79 |
ano |
ne |
15/II |
Praefatio ODO II |
83–90 |
ano |
ne |
15/II |
Novissima lingvarum methodus |
91–475 |
ano |
ne |
15/II |
zkratky |
ano |
ano |
|
15/II |
rejstřík |
ano |
ano |
|
17 |
Artificii legendi et scribendi tirocinium |
7–33 |
ano |
ne |
17 |
Vestibuli et januae lingvarum lucidarium |
35–52 |
ne |
ne |
17 |
Orbis sensualium pictus |
53–300 |
ano |
ano |
17 |
zkratky |
ano |
ano |
|
17 |
rejstřík |
ano |
ano |
|
18 |
Judicium de responsione serarii |
35–68 |
ano |
ano |
18 |
Unum necessarium |
69–146 |
ano |
ano |
18 |
Janua rerum reserata |
147–236 |
ano |
ano |
18 |
Triertium catholicum |
237–365 |
ano |
ne |
18 |
zkratky |
ano |
ano |
|
18 |
rejstříky |
ano |
ano |
|
23 |
Clamores Eliae, 1. část |
1–493 |
ano |
ano |
23 |
Clamores Eliae, 2. část |
1–493 |
ano |
ne |
23 |
zkratky |
ano |
ano |
|
23 |
rejstřík |
ano |
ano |