back Autor : ©Jan B. Hurych
Název : JEŠTĚ K FREKVENČNÍM CHARAKTERISTIKÁM






V minulém článku "FREKVENČNÍ CHARAKTERISTIKY PÍSMEN VE VM" jsme si ukázali křivky četnosti jednotlivých písmen ve VM. Použili jsme ke srovnání vzorky středověké latiny a angličtiny. Zjistili jsme též, že na rozdíl od angličtiny, latina má velmi podobnou křivku, teda něco co jsme neočekávali - i když bychom vlastně měli, protože latina byl v té době nejen jazykem mezinárodním, ale i jazykem vědy a teda ten nejvážnější kandidát na jazyk VM.



Výpočet jsem opakoval ještě pro celou knihu sv. Augustina, abych měl větší vzorek a tím i přesnost. Na grafu níže vidíte křivku pro jednu kapitolu (LAT1) a pro celou knihu (LATINTOT). Očekával jsem, že výsledek se bude lišit - ano lišil se, ale tak, že se ještě více přiblížil VM!


Jak už jsem napsal, nejen že je křivka latiny blízká VM - až neuvěřitelně, ale důležité jsou hlavně ony "skoky" ve stejném místě a směru a také jakési souhlasné "seskupení" tam, kde je spíše "plateau", tj. pro část se stejným počtem "sousedních" písmen. Je pravda, že hodně autorů už navrhovalo latinu jakožto jazyk VM, vede nás k tomu už sama historie, ale neměli ještě důkaz. Navíc jsme v posledním článku ukázali, že angličtina je jazyku VM vzdálena.

Pro jistotu jsm vyzkoušel jiného důležitého "kandidáta", češtinu. Grafy ale ukazují, že podobně jako angličtina, čeština se od VM liší daleko více, než latina. Použil jsem pro vzorek text knihy "Labyrint světa" od Komenského, také ze 17ho století, ze stránky zde
Udělal jsem dvojí výpočet:
1) bez diakritiky, označený "CZASCI", a
2) s diakritikou, označený"CZDIA" , kde rozlišuji například mezi "s" and "š".
Naštěstí má VM dost různých symbolů písmen na to, aby se pokryla i písmenka s diakritikou jakožto zvláštní písmena.



Spojil jsem prvních deset kapitol "Labyrintu", abych dostal vzorek asi stejné délky, jako má VM. Ovšem uvedený text je napsán dnešní diakritikou, v oné době ještě neustálenou (např. někde se psalo cz místo "č", viz Hoczicky a podobně) a chtělo by to přesný rozbor. Zajímavé je, že Komenský psal nespojitě, ne kurzivou, ač ta byla známa už asi dvěstě let. Ovšem čeština má, podobně jako angličtina, dostatek dlouhých slov, něco, co VM chybí, ale to zde nehrálo roli, statistika se týká jen samotných písmen. Výsledek je ale celkem jasný: VM nebyl napsán v prosté, nezakódované češtině. Je možné, že byl napsán v zakódované češtině, ale to by šlo určit přesně po odkódovánía my zatím nevíme, jak to udělat.

Zkoušel jsem i jiné jazyky, např. litevský, ale bohužel jen současný, ne středověký. I tak se zdá latina být tím nejpravděpodobnějším jazykem, už proto, pokud VM napsal nějaký vzdělanec někde mezi rokem 1200 a 1670.

Sestavil jsem také na základě statistiky konverzní tabulku "VM-LATIN" , viz níže. Neuvažoval jsem ovšem ta písmena, kde je už v definici nejistota. Tak například abeceda EVA používá v přepisu kombinace dvou či tří písmen (ch, ans, sh, cth, ckh, atd.) pro jednoduchá, samostatná písmena VM, na rozdíl od Friedmana, který má pro to zcela jiné - ale vždy jen jednoduché - znaky (třeba číslice, ale rozhodně ne komnibace více písmen). EVA byla prostě vedena grafickou podobností a autoři nepřemýšleli, jak si s tím poradí počítač :-). Pokud se tato otázka nevysvětlí, nemá cenu zatím výpočet komplikovat a musíme se potýkat s jistou nepřesností či mnohovýznamostí. Navíc byly některé znaky ve VM nečitelné, díky poškození rukopisu či nepřesnému psaní. Naštěstí se to netáká znaků, které se vyskytují nejčastěji, takže je tabulka v tomto smyslu jednoznačná.

VM o e h y a c d i k l r t s q n p m f g x v
LATINE I T A U S N M R O C D L P Q B V F G H X


Pro rozlišení jsem použil pro VM malá písmena EVY, pro mou "latinskou" konverzi pak písmena veliká. Pochopitleně jsem se hned snažil i "přeložit" VM do latinské nomeklatury. Výsledek je zde (vykřičníky a jiná znaménka nepředstavují čitelný text, můžete je tedy zanedbat).  
VM <folio fi1r>, originání zápis v abecedě EVA:
kchsy.chadaiin.ol-!!!!!!!oltchey.char.cfhar.am- yteeay.char.or.ochy-!!!!!!!dcho.lkody.okodar.chody- dao.ckhy.ckho.ckhy.shy-!!!!!!!dksheey.cthy.kotchody.dal- dol.chokeo.dair.dam-!!!!!!!sochey.chokody= potoy.shol.dair.cphoal-!!!!!!!dar.chey.tody.otoaiin.shoshy- choky.chol.cthol.shol.okal-!!!!!!!dolchey.chodo.lol.chy.cthy- qo.ol.cho*es.cheol.dol.cthey-!!!!!!!ykol.dol.dolo.ykol.do!l!ch!!ody- okol.shol.kol.kechy.chol.ky-!!!!!!!chol.cthol.chody.chol.daiin- shor.okol.chol.dol.ky.dar-!!!!!!!shol.dchor.otcho.dar.shody- taor.chotchey.dal.chody-!!!!!!!schody.pol.chodar=
Konverze (substitucí do latinské abecedy):
RSTLA.STUNUMMN.EO-!!!!!!!EODSTIA.STUC.SFTUC.UM- ADIIUA.STUC.EC.ESTA-!!!!!!!NSTE.ORENA.ERENUC.STENA- NUE.SRTA.SRTE.SRTA.LTA-!!!!!!!NRLTIIA.SDTA.REDSTENA.NUO- NEO.STERIE.NUMC.NUM-!!!!!!!LESTIA.STERENA= PEDEA.LTEO.NUMC.SPTEUO-!!!!!!!NUC.STIA.DENA.EDEUMMN.LTELTA- STERA.STEO.SDTEO.LTEO.ERUO-!!!!!!!NEOSTIA.STENE.OEO.STA.SDTA- PE.EO.STE*IL.STIEO.NEO.SDTIA-!!!!!!!AREO.NEO.NEOE.AREO.NE!O!ST!!ENA- EREO.LTEO.REO.RISTA.STEO.RA-!!!!!!!STEO.SDTEO.STENA.STEO.NUMMN- LTEC.EREO.STEO.NEO.RA.NUC-!!!!!!!LTEO.NSTEC.EDSTE.NUC.LTENA- DUEC.STEDSTIA.NUO.STENA-!!!!!!!LSTENA.PEO.STENUC=

A opravdu, v tomto textu najdeme zlomky slov či zkomolená slova latiny, dokonce více, než by se pro náhodný text očekávalo. Tak např. NEO-, -EDEA-, -STENA, -NUM-, - OSTIA -, -EDEU-, -ERUO-, -AREO-, -REO-, -NUC-, a pod. Ovšem musíme být opatrní, mnoho výzkumníků už ztroskotalo právě na zdánlivé podobnosti. Neočekával jsem pochopitelně hned přímé řešení - nakonec transkript v abecedě EVA i naše tabulka jsou jen první přiblížení, ale tolik zlomků slov z latiny je i pro mě dost překvapivé. Dále zatím nepůjdeme - víme, že někde za tím vším může být latina, ale jak už jsem řekl, může jít ještě i o nějakou jinou kombinaci s další šifrou nebo možná kódem. Pro ty, co to zajímá, uvádím ještě "překlad ".dvou dalších folií.
 
VM folio <fi1v>
kydainy.ypchol.daiin.otchal-!!!!!!!ypchaiin.ckholsy- dorchory-!!!!!!!chkar.s-!!!!!!!shor.cthy.cth!- qotaiin-!!!!!!!cthey.y-!!!!!!!chor.chy.ydy-!!!!!!!chaiin- *haiidy-!!!!!!!chtod.dy-!!!!!!!cphy.dal!s-!!!!!!!chokaiin.d- otochor.al-!!!!!!!shodaiin-!!!!!!!chol.!dan-!!!!!!!ytchaiin.dan- saiin.daind-!!!!!!!d!kol.sor-!!!!!!!ytoldy-!!!!!!!dchol.dchy.cthy- shor.ckhy.daiiny-!!!!!!!chol.dan= kydain.shaiin.qoy.s.shol.fodan-!!!!!!!yksh.olsheey.daiildy- dlssho.kol.sheey.qokey.ykody.so-!!!!!!!chol.yky.dain.daiirol- qoky.cholaiin.shol.sheky.daiin-!!!!!!!cthey.keol.s!aiin.saiin- ychain.dal.chy.dalor.shan.dan-!!!!!!!olsaiin.sheey.ckhor- okol.chy.chor.cthor.yor.an.chan-!!!!!!!saiin.chety.chyky.sal- sho.ykeey.chey.daiin.chcthy= ytoain=
Konverze:
RANUMNA.APSTEO.NUMMN.EDSTUO-!!!!!!!APSTUMMN.SRTEOLA- NECSTECA-!!!!!!!STRUC.L-!!!!!!!LTEC.SDTA.SDT!- PEDUMMN-!!!!!!!SDTIA.A-!!!!!!!STEC.STA.ANA-!!!!!!!STUMMN- *TUMMNA-!!!!!!!STDEN.NA-!!!!!!!SPTA.NUO!L-!!!!!!!STERUMMN.N- EDESTEC.UO-!!!!!!!LTENUMMN-!!!!!!!STEO.!NUN-!!!!!!!ADSTUMMN.NUN- LUMMN.NUMNN-!!!!!!!N!REO.LEC-!!!!!!!ADEONA-!!!!!!!NSTEO.NSTA.SDTA- LTEC.SRTA.NUMMNA-!!!!!!!STEO.NUN= RANUMN.LTUMMN.PEA.L.LTEO.FENUN-!!!!!!!ARLT.EOLTIIA.NUMMONA- NOLLTE.REO.LTIIA.PERIA.ARENA.LE-!!!!!!!STEO.ARA.NUMN.NUMMCEO- PERA.STEOUMMN.LTEO.LTIRA.NUMMN-!!!!!!!SDTIA.RIEO.L!UMMN.LUMMN- ASTUMN.NUO.STA.NUOEC.LTUN.NUN-!!!!!!!EOLUMMN.LTIIA.SRTEC- EREO.STA.STEC.SDTEC.AEC.UN.STUN-!!!!!!!LUMMN.STIDA.STARA.LUO- LTE.ARIIA.STIA.NUMMN.STSDTA= ADEUMN=
 
VM <folio f2v>
kooiin.cheo.pchor.otaiin.o!dain.chor-!!!!!!!dair.shty-
kcho.kchy.sho.shol.qotcho.loeees.qoty-!!!!!!!chor.daiin-
otchy.chor.lshy.chol.chody.chodain-!!!!!!!chcthy.daiin-
sho.cholo.cheor.chodaiin=
kchor.shy.daiiin.chckhoy-!!!!!!!s!shey.dor.chol.daiin-
dor.chol.chor.chol.keol.chy.chty-!!!!!!!daiin.otchor.chan-
daiin.chotchey.qoteeey.chokeos-!!!!!!!chees.chr.cheaiin-
chokoishe.chor.cheol.chol.dolody=
KONVERZE:
REEMMQ.STIE.BSTEC.EDUMMQ.E!NUMQ.STEC-!!!!!!!NUMC.LTDA- RSTE.RSTA.LTE.LTEO.PEDSTE.OEIIIL.PEDA-!!!!!!!STEC.NUMMQ- EDSTA.STEC.OLTA.STEO.STENA.STENUMQ-!!!!!!!STSDTA.NUMMQ- LTE.STEOE.STIEC.STENUMMQ= RSTEC.LTA.NUMMMQ.STSRTEA-!!!!!!!L!LTIA.NEC.STEO.NUMMQ- NEC.STEO.STEC.STEO.RIEO.STA.STDA-!!!!!!!NUMMQ.EDSTEC.STUQ- NUMMQ.STEDSTIA.PEDIIIA.STERIEL-!!!!!!!STIIL.STC.STIUMMQ- STEREMLTI.STEC.STIEO.STEO.NEOENA=

Znáte-li latinu, možná, že vás napadne něco zajímavého. Koneckonců i jazykovědce by mohla tato konverze zajímat: vždyť každý jazyk má vlastně svým způsobem nejen jistou kódovací knihu (slovník) ale i algoritmy (gramatiku) - podle kterých použitá slova modifikujeme a sestavujeme do vět. Jazykozpytci mi snad prominou toto "bagatelizování", zmiňuji se zde o tom jen proto, že to pro naše účely dává perfektní smysl. Jiný algoritmus pak ovšem ještě přináší samo zašifrování . . .