Nahlédněte i do Diskuse pod čarou!

Základní vysvětlení ke kódování znaků

Hledáte-li vysvětlení nějakého jevu rázu spíše jazykového než technického, snad vám poradí některý z našich odkazů.

Co je to znak?

Jeden znak v počítačové terminologii znamená jedno písmenko. Je reprezentován jedním bytem (nebereme-li v úvahu Unicode), proměnnou dosahující 256 hodnot. Každé z těchto hodnot (tj. číselnému kódu) je přiřazeno určité písmeno. Znak se na obrazovce vykreslí právě oním přiřazeným písmenem. Této asociaci určitého písmene k určitému kódu se jinak říká kódování, sadě těchto asociací pro všech 256 možných kódů pak znaková sada.

ASCII

ASCII je jakž takž zažitý standard pro kódování malé a velké abecedy, číslic, interpunkce a dalších znaků včetně zvláštních řídících kódů jako je např. skok na nový řádek*. ASCII tedy svým rozsahem kryje potřeby angličniny a "cestiny", žádný vlastenec ji však nemůže přijmout za svou.

Standard ASCII popisuje "dolní polovinu" kódové tabulky - přiřazuje znaky kódům od 0 do 127. Zbytek kódování (kódy 128 až 256) je tedy víceméně volný. Z tohoto důvodu se také vyvinulo nespočet různých druhů kódování, která nám teď svou různorodostí zapříčiňují mnohé problémy.

[Tabulka ASCII]
Znaky obsažené v ASCII

Význam znakové sady ASCII dokládá existence a činnost Konsorcia ASCII.


Poznámky:

  1. Skok na nový řádek má také několik různých kódů, i když je na to ve všech WWW klientech naštěstí pamatováno. Pro úplnost dodávám, že pod operačním systémem unix je vyjadřován kódem LF (hexadecimální kód$0A, zkratka Line Feed), na Macintoshi má tento význam znak CR ($0D, zkratka Carriage Return) a na PC je užívána kombinace obojího: CRLF ($0D0A).