bullet next back Autor : Jan B. Hurych
Název : UMÍME SAMOSTATNĚ MYSLET?
Kapitola: STEGANOGRAFIE




Do steganografie bych zařadil - z nedostatku lepšího rozdělení - zhruba tyto metody:

a) zmenšení tajného textu
b) tajemný inkoust
c) zamontování tajemného textu do normálního písma, obrázku, programu či datafajlu, a pod.

O steganografii jsme se zmínili zatím jen běžně. Její začátky ale možná ještě předbíhají samotnou kryptografii: jde v ní totiž o to ve zdánlivě normální zprávě uschovat informaci, která by nebyla jasná - případně ani patrná - někomu, komu není zpráva určena. To je jistě to nejlepší utajení :-).




Tak například stačí v dopise udělat narážku "jak známo" bez dalších detailů nebo použít nevinný kód pro osobu či místo (tak například adresát je osloven jako "Karel", což je jen krycí jméno). Zajímavý příklad je je z řecké Iliady, kde doručovatel zprávy, v tomto případě mělo jít o "dobré doporučení jeho samého", došel špatného konce. Zpráva totiž obsahovala větu: "Zacházej s tímto mužem jako s Glaukem", přičemž pisatel věděl - na rozdíl od posla - že adresát nechal Glauka popravit :-).

Tyto poměrně primitivní triky jsou navíc zesíleny tím, že nikdo jiný než adresát nezná detaily anebo dokonce ani zprávu nepřečte pozorně. Složitější případy ovšem navíc používají něco, co vlastně už hraničí s kódováním, i když třeba neúplným. Tak například se čtou jen první písmena každého třetího slova nebo chcete-li něco složitějšího: druhé písmeno každého čtvrtého slova, čteno ale od konce zprávy. Možností je zde tolik, že řešení není opravdu lehké najít v rozumném čase - a to navíc musíme vytušit, že ve zprávě vůbec něco ukryto je.

Rafinovanější steganografie používá ještě různá vylepšení. Nejznámější je asi to od Francise Bacona, (1561-1626), údajného autora Shakespearovských děl, jinak též otce vědecké indukce - ano, toho, co napsal kromě filozofických knih  i eseje o šifrách ("The Epistle of the Secret Works of Art and the Nullity of Magic"). V knize " The Advancement and Proficience of Learning" ( Pokrok a poznání v učení, Francis Bacon, p 257-71, Book VI, 1640 ) je popsána sice jakási šifra substituční  - skupina každých 5 písmen zde udává jedno písmeno originálního textu, ale skrytá navíc v textu tak, že ji nelze lehce objevit. 

 Tuto šifru vynalezl a popsal autor sám a její kód je podobný morseovce, jen místo tečky je užito písmeno psané typem "a" a místo čárky písmeno psané typem  "b". Výhoda je jasná - pisatel nemusí normální text  "upravovat", význam písmen textu není utajený, "d" je "d",  jen psané trochu  jinak  Přitom to nedělá obsah textu podezřelý, jsou to postě jen  jiné "fonty", jako v tiskárně, ovšem daleko mén ě odlišné ( šlo o ručně psaný text)  Bacon tam dokonce přidal i tabulku, jak ta prvá a druhá písmena vypadají. Tam ale také podobnost s morseovkou končí - jak už jsem napsal, každý kód má pět písmen a je zajímavé, že Bacon je už tehdy seřadil přesně podle binárního ( dvouhodnotového) kódu, používaného v dnešních počítačích. Bereme-li font a=0, font b=1, pak :

pís.    č.    binární
---------------------- 
    A	  1     00001	
    B	  2     00010	 
    C	  3     00011	 
    D	  4     00100  
    E	  5     00101   
    F	  6     00110	
    G	  7     00111   
    H	  8     01000	 
    I	  9     01001	
    J	 10     01010	 
    K	 11	01011	 
    L	 12	01100	
    M	 13	01101	 
    N	 14	01110	  
    O	 15     01111	
    P	 16	10000	 
    Q	 17	10001	
    R	 18	10010	 
    S	 19	10011	
    T	 20	10100	
    U	 21	10101	
    V	 22	10110	 
    W	 23	10111	
    X	 24	11000	
    Y	 25	11001	
    Z	 26	11010	
(převzato z: http://www.cl.cam.ac.uk/~mgk25/gchq-challenge.html, to je stránka, kde si s touto šifrou hrají :-). Počet kombinací je ovšem 2 na pátou, tedy 32, na abecedu tedy nemusel Bacon použít všechny, ale jen 26. Také nepoužil kombinace 00000 a 11111, neboť by byly podezřelé.

Tak např. chceme poslat zprávu: "nepřítel dorazil" - pro náš účel ji zbavíme háčků a čárek. tj. "nepritel dorazil". Zpráva má 15 písmen a my ji překódujeme podle tabulky na:
	n	01100
	e	00101
	p	10000
	r	10010
	i	01001
	t	10100
	e	00101
	l	01100
	d	00100
	o	01111
	r	10010
	a	00001
	z	11010
	i	01001
	l	01100
Potřebujeme tedy (jakýkoliv) text o minimálně 5x15=75 písmenech, který rozdělíme po pěti písmenech, např.

Ukáza-l se bý-t tak n-adaný- že ho m-ěšťan-é nech-ali st-udova-t v sem-ináři- pro ch-udé st-udent-y a poz-ději ...

Pod každou pětimístnou skupinu (zde oddělenou pomlčkou) napíšeme podle výše uvedené tabulky dané písmeno, tak např. pod slovo 
Ukáza: napíšeme kód pro "n":
01100 , a pro každou jedničku přepíšeme daná písmena kursivou (italikou), tedy
Uza a celý výsledek je pak zde:

Uzal se být tak nadaný, že ho měšťané nechali studovat v semináři pro chudé studenty a později ...
Doufám, že rozpoznáte, co je vytištěno normálně a co kurzivou ( nakloněně). Pochopitelně, že to Bacon nepsal kurzívou (to by bylo moc nápadné), ale ta písmena změnil, třeba jen tak, že byla zakončena malým obloučkem, místo rovnou čarou. Protože byl text jinak zcela čitelný a nevinný, nikoho ani nenapadlo, že je v něm zakódována zpráva. Opačný proces pak byl, že si adresát vzal celý text a přepsal si ho ve skupinách po pěti písmenech. Pak si v každé skupině označil jinak napsaná písmena (fontem "b", zde tedy kursivou) třeba podtržením, přepsal si to na kód (třeba skupinu "uza" na 01100) a podle tabulky si zjistil písmeno, které dané pětimístné skupině odpovídá, v našem případě "n".

Je zajímavé, že tento binární kód se přisuzoval až teprve Leibnitzovi, který jej použil o 200 let později ve své kalkulační mašině. Zdá se ale, že se binární kód vyskytuje i jinde, v přírodě, je to totiž normální číselná řada, ale vyjádřená ve dvojkové soustavě. Např. Skot John Napier, vynálezce logaritmů, podobnou škálu používal už v roce 1607. Ještě dnes se vlastně používá v počítačích a to i pro písmena, jakožto ASCII kód. Na druhé straně, jelikož to Bacon sám publikoval, osobně by asi tento kód už zrovna příliš moc nepoužíval - :-). 

Podle Bacona totiž nejde jen o to text zašifrovat, ale hlavně to udělat tak, aby to bylo nenápadné. Zde přichází v úvahu, zda se Bacon zastavil jen u této poměrně jednoduché, leč prostor zabírající šifry (sám přiznává, že je potřeba pětkrát víc písmen na celou zprávu) nebo jestli šel dále. Jistě měl ještě jinou šifru v zásobě pro své účely, kterou ale už raději nepublikoval :-). Možná, že používal  kombinace vyšší, než binární. Tak třeba ternární neboli trojhodnotovou číslicovou soustavu  - ta horní byla dvojková :-)). Tam kombinace vyžadují jen třímístný kód a je jich  27 (=3 na třetí), což na abecedu klidně stačí.

   pís.  dec ternární 
  ------------------------------------
    A     1  000
    B     2  001
    C     3  002
    D     4  010
    E     5  011
    F     6  012
    G     7  020
    H     8  021
    I     9  022
    J    10  100
    K    11  101
    L    12  102
    M    13  110
    N    14  111
    O    15  112
    P    16  120
    Q    17  121
    R    18  122
    S    19  200
    T    20  201
    U    21  202
    V    22  210
    W    23  211
    X    24  212
    Y    25  220
    Z    26  221
	
Pak by ovšem ale musel mít tři různé abecedy, tedy fonty, ale zato by potřeboval  jen třikrát delší dopis než je tajný text. O ternárních kombinacích jsem ale ani u Bacona, ani nikde v literatuře v této spojitosti nenašel zmínku, neboť mě to napadlo zrovna teď.  Navíc není tak lehké najít způsob, jak psát každé písmeno trojím - a hlavně nenápadným - způsobem, ačkoliv i to se dá vymyslet. Vážnější námitkou ovšem je, že tři druhy fontů by byly v  textu asi víc nápadné :-). 

Poznámka: samozřejmě, že používat takový systém by bylo pracné, uvedl jsem  ho jen proto,  že už Bacon  vlastně znal dvojkovou soustavu. Dnešní steganografie je jiná: přidá se vám text nenápadně do obrázku na netu (už existují programy, které to umí pro formát JPG i GIF) a i takový virus je vlastně něco, co se schovává v jiném textu, případně programu. Pak je ovšem těžké něco takového hledat, i když něco tušíte.. I taková jednoduchá stránka na netu, typu HTM může mít v sobě informaci ve formě normálně neviditelných poznámek. Stačí, když si nějakou stránku otevřete a v browseru si nahoře ťuknete na "View Source" neboli "Zdrojový kód". V závorkách ve tvaru šipky jsou pak poznámky, jinak neviditelné. Jenže prohledávejte takhle celý Internet! :-).

Kdysi jsem provedl malý žertík známému,  který mě jednou žádal o  kopii mé zprávy, kterou "nutně potřeboval". Už  už jsem mu ji málem poslal, když mě napadl malý žertík: přepsal jsem jednu stránku tak, že jsem tam do jednoho paragrafu vložil větu: "Neříkej, že jsi zrovna tohle tak nutně potřeboval.", ovšem normálním fontem a bez uvozovek  Přetiskl jsem tu celou stránku  na tiskárně, vložil do zprávy na místo té staré, sešil sešívačkou a poslal mu  ji. Nikdy se neozval a já neměl to srdce, abych se ho zeptal. Kdybych byl  na jeho místě, tak by mi  to také ušlo, ačkoliv si  každý textu, než ho studuji, přejedu rychle zrakem, abych  věděl, co vůbec stojí za to číst. Většinou to bývá asi tak dvacet procent :-).