Jisté okolnosti mě vedli k tomu, abych napsal tuto stránku o kódování českého jazyka na PC. Rozhodně nechci vyčerpávajícím způsobem v tabulkách ukázat, jakým dvoj anebo trojhmatem se ten který český nebo speciální znak napíše, ale chci podat základní informaci, jaké kódování je vhodné používat v určitých aplikacích.

Kódování LATIN 1

Toto kódování se označuje jako západoevropské jazyky. Zobrazí se v prohlížečích, pokud daný dokument neobsahuje informace o kódování.

Kódování LATIN 2 (ISO 8859-2)

Je standardem pro kódování českého jazyka na systému UNIX, LINUX a akceptuje se i v systému Windows. V prohlížeči Internet Exploreru je označován jako středoevropské (ISO).

Kódování Windows - 1250

Windowsovské kódování v prohlížečích Internet explorer a označuje se jako středoevropské. Je doporučeno pro www aplikace. Používá jej Front Page jako základní kódování.

Kódování Mac CE

Macintoshovské kódování pro střední Evropu.

Kódování pro DOS

Dnes se používá velmi zřídka, jen u starších programů pod OS MS_DOS.


Co je vlastně to kódování?

Počítač ke každému písmenku vlastně přiřadí určité číslo a to od 0 do 255 (jeden bajt).
V angloamerických zemích a programátoři si vystačí se 128 znaky. Těmto základním 128 znakům se říká ASCII (American Standard Code for Information Interchange (Americký standardní kód pro výměnu informací).
Číslicemi od 128 do 255 se označily diakritizované znaky jazyků západní Evropy a tak vznikl kód Latin-1. Vněm české znaky nejsou (kromě á a í). Pro latinské jazyky střední a východní Evropy vznikly různé kódy, které zachovávají význam prvních 128 znaků ASCII (normalni pismena latinske abecedy bez diakritiky), ale dalších 128 znaků je definováno po svém. A právě různá přiřazení diakritizovaných znaků se číslům od 128 do 255 se označují jako kódování.

Problémem ale je to, že že si hodně lidí usmyslelo, že udělají kódování českého jazyka, jenomže každý to udělal jinak a po svém.


Argument pro ISO 8859-2

Samozřejmě, že pro www aplikace pod windows se standardně používá kódování windows - 1250 (Front Page). Ale argumenty z praxe hovoří spíše pro LATIN 2 (ISO 8859-2). Zásadní argument je v tom, že ISO kódování se výhradně používá v Unixu a Linuxu. Právě Unixovské a Linuxovské programy win kódování nějakým způsobem přepíšou, ale není to dobré. Proto tento argument hovoří spíše pro ISO 8859-2.

Argumenty pro windows-1250

Poznámkový blok (Notepad) je nejjednoduším textovým editorem, ve kterém se nedá přepnout kódování a používá pouze Windows-1250. pokud se pohybujete pouze v prostředí windows, používejte výhradně toto kódování. Vyhnete se tak zbytečným problémům.

Rozdíly

Nejpoužívanější win kódování Windows - 1250 a ISO 8859-2 se ve psaní českých znaků odlišují pouze v šesti znacích.
Jsou to: š, ž, ť, Š, Ž, a Ť.

Další kódování

Např. kódování bratří Kamenických, Mac anebo čeština pro DOS se dnes již na webu téměř neobjevují - téměř nestojí za to věnovat jim velkou pozornost. Kód UNICODE je prozatím hudbou budoucnosti.

Přepínání v prohlížeči

Prohlížeče www stránek např. IE od v.3 a kromě Opery umožňují překódovat text přímo na straně klienta. Uživatel si jednoduše vybere kódování a zkouší různá kódování, dokud to není správně česky. Je to jednoduchý způsob. Starší prohlížeče se dnes naštěstí používají velmi málo - tam je s kódováním velký problém a lepší je provést púřímo Uptade z internetu na IE v.5 nebo 6.
Výběr vhodného druhu kódování se v IE v.5 provede jednoduše. V horní liště Zobrazit vybereme kódování a rozbalí se nám roletka s následujícím výběrem:
  • Automatický výběr (pokud zadáte tuto volbu, prohlížeč sám vybere příslušné kódování - ne vždy to ale funguje spolehlivě!).
  • Středoevropské jazyky (Windows)
  • Západoevropské jazyky (Windows)
  • Cyrilice (Windows)
  • středoevropské (ISO)
  • Západoevropské (ISO)
  • Další - Nutná instalace z netu (např. Arabština, Cyrilice, Řečtina, Hebrejština....apod.)

    Zde naleznete odkazy týkající se problematiky kódování českého jazyka (včetně ASCII tabulky) na platformě PC:
  • http://www.labo.cz/mft/matasciit.htm,
  • http://sedlar.webpark.cz/menu/ascii.html,
  • http://beta.vse.cz/kizi/information/ASCII2.html,
  • http://www.mujweb.cz/Pocitace/bennda/soubory01/Nazvy.html.