Nahlédněte i do Diskuse pod čarou!

Statická řešení poskytování českých stránek

Dokument, který vy napíšete v jednom kódování, se musí přeložit do všech kódování, která jste se rozhodli podporovat. Tuto sadu dokumentů pak musíte umístit na váš server, kde bude každému k dispozici.

V současné době lze za ideál považovat server, který vystavuje stránky jen v ISO-8859-2 a rovněž bez háčků - a na tohle už i statické řešení bohatě postačuje.

[Výhody] Výhody tohoto způsobu jsou bohužel mizivé, pro konečného uživatele je to však určitě lepší, než jen "cestina". Sám jsem musel tento způsob relativně dlouhou dobu praktikovat a zas tak náročný mi nepřipadal. Jako výhodu lze snad uvést rychlost, protože přenos není zdržován překladem a vzdálenější počítače mohout tento soubor nalézt v proxy cache, což se u výstupu CGI-skriptu nemůže nikdy stát.

[Nevýhody] Každý soubor zabírá na disku svými kopiemi několikanásobně větší místo, než je jeho skutečná velikost, musíte se ručně starat o jeho překonvertování, i když to po vytvoření podpůrných programů není takový problém.

Jak se stránky staticky poskytují?

Především je vhodné si zavést určitá označení pro daný druh kódování. V době, kdy jsem tento způsob používal jsem se rozhodl, že před koncovku .html každého souboru předřadím ještě koncovku určující kódování souboru - tzv. identifikátor.

[Tabulka zalomená v ASCII] Příklad identifikátorů kódování souborů, které jsem používal já.
Identifikátor Název kódování Oblíbené na platformě
.ISO2. ISO 8859-2 systém unix, přečte naprostá většina všech WWW klientů
.CE. Central Europe Macintosh
.ISO1. CE "přebalené" do ISO 8859-1 Macintosh
.CP1250. CP 1250 Windows
.Latin2. PC Latin 2 DOS
.ces. ASCII všechny platformy
.eng. Anglická verze souboru

Pokud to bude jen trochu technicky možné, snažte se však nezavádět žádná nová jména pro známá kódování. Držte se názvů definovaných v MIME - seznam těch nejpoužívanějších naleznete zde.

Jen na okraj přidávám poznámku o možnosti klientů požadovat pomocí svého nastavení oblíbeného jazyka (Accept-Language) rovnou jeden z těchto klonů souborů. Jediným předpokladem je, že váš HTTP server jazykové mutace dokumentů zvládá (zvládat by měl, definice rozhraní je snad již v HTTP 1.0).

O této možnosti (i problémech s nestandardním označováním znakových sad) se více dozvíte v popisu MIME, konkrétné v této části.

Soubory jsou tedy snadno rozlišitelné, problém nastává jen s odkazy v souborech, protože se předpokládá, že kódování by mělo být při skoku na další stránku zachováno. Předpokládejme, že je výchozím kódováním třeba CE. Odkazy na další stránky mají tedy také koncovku .CE.html. Po převodu do jiného kódování (např. ISO-8859-2) by však měly mít koncovku odpovídající jejich kódování (tedy .ISO2.html). Během konverze kódování se tedy musí v celém textu dokumentu identifikátory výchozího kódování nahradit identifikátory kódování, do nějž je soubor právě převáděn.

Kromě popsané možnosti zavedení identifikátorů kódování existuje i jiná - ukládání souborů do adresářů podle kódování.

Ať tak či onak, budete rozhodně potřebovat nějaký program, který za vás celou sbírku rozličných kódování vyrobí. Snad si vyberete z naší nabídky.