Tekst ten ma ułatwić redagowanie kaszubskojęzycznych stron internetowych.
Przedstawię dwie - moim zdaniem najlepsze - możliwości prezentacji kaszubskojęzycznych tekstów w internecie.
Marek Kwidziński (grudzień 2002)
Spis treści:
I.Zestawienie kaszubskich “ogonków” w iso - 8859-1, iso - 8859-2, utf-8 jak i alternatywnym zapisie html.
II. Unicode - Standard dla języka kaszubskiego.
1. Początek strony w utf - 8.
2. Jak pisać?
3. Przykład
III. ISO-8859-2 ( ISO-Latin-2 )
1. Początek strony w iso-8859-2.
2. Jak pisać?
- Zestawienie alternatywnego zapisu kaszubskich “ogonków” html.
3. Przykład
Tab. 1 - Kaszubskie “ogonki” w : iso - 8859-1, iso - 8859-2, utf-8 jak i alternatywnym zapisie html.
|
HTML 4.0 |
ISO-8859-1 | ISO-8859-2 | HTML - Alt. | UNICODE |
| Ą | - | ¡ | - | Ą |
| ą | - | ± | - | ą |
| Ã | Ã | - | Ã | Ã |
| ã | ã | - | ã | ã |
| É | É | É | É | É |
| é | é | é | é | é |
| Ë | Ë | Ë | Ë | Ë |
| ë | ë | ë | ë | ë |
| Ł | - | £ | - | Ł |
| ł | - | ³ | - | ł |
| Ń | - | Ñ | - | Ń |
| ń | - | ñ | - | ń |
| Ò | Ò | - | Ò | Ò |
| ò | ò | - | ò | ò |
| Ó | Ó | Ó | Ó | Ó |
| ó | ó | ó | ó | ó |
| Ô | Ô | Ô | Ô | Ô |
| ô | ô | ô | ô | ô |
| Ù | Ù | - | Ù | Ù |
| ù | ù | - | ù | ù |
| Ż | - | ¯ | - | Ż |
| ż | - | ¿ | - | ż |
Unicode - standard dla stron kaszubskojęzycznych (i nie tylko
).
Obsługuje on wszystkie kaszubskie znaki (patrz: tabela pierwsza), co ułatwia pisanie jak i publikację stron internetowych.
Wszystkie przeglądarki od wersji 4.0 prezentuja kodowane w nim strony poprawnie. (*)
<!DOCTYPE HTML PUBLIC “-//W3C//DTD HTML 4.01 Transitional//EN”>
<html>
<head>
<meta http-equiv=”Content-Type” content=”text/html; charset=utf-8“>
</head>
</html>
Sam kod utf-8, dzięki pełnemu poparciu kaszubskich znaków, umożliwia ich późniejszą czytelną prezentację w sieci. Wielką jego zaletą jest też możliwość prezentacji stron w językach mieszanych, co w przypadku prac kaszuboznawczych (występujących m.in. w : polskim, niemieckim, czy też rosyjskim) wydaje się być kolejnym argumentem przemawiającym za nim.
Nie oznacza to jednak, ze nie można stosować alternatywnego zapisu z tabeli drugiej, czy też numerycznego zapisu utf-8 z tabeli pierwszej.
Od momentu pojawienia sie w sieci kaszubskiego edytora tekstów KaszED, publikowanie tekstów w języku kaszubskim przestało być “ekwilibrystyką”. Program ten umożliwia zapisywanie plików tekstowych w utf-8, które to można po zakończonej pracy najzwyczajniej w świecie “wkleić” do części kodu html.
3.Przykład
Chcecie na stronie kodowanej w utf-8, napisać : Naji ùczbë.
Początek
<!DOCTYPE HTML PUBLIC “-//W3C//DTD HTML 4.01 Transitional//EN”>
<html>
<head>
<meta http-equiv=”Content-Type” content=”text/html; charset=utf-8″>
<title>Tytuł</title>
<body>
Miejsce na wasz tekst: Naji ùczbë. (**)
</body>
</head>
</html>
Koniec strony
(*) To, że starsze (poniżej wersji 4.x) jak i tekstowe przeglądarki mają problemy w prezentacji stron kodowanych w utf-8, jest napewno mankamentem, nie wolno jednak o tym zapomnieć, iż nie ma innej alternatywy na czytelne dla nich strony kaszubskojęzyczne.
(**) Nie oznacza to jednak, ze nie można stosować poniższych zapisów:
Naji ùczbë czy Naji ùczbë które to w przeglądarkach wyglądają jak “zwyczajnie” zapisany tekst.
Naji ùczbë - w html jak: Naji ùczbë
Naji ùczbë - w html jak: Naji ùczbë
III. ISO-8859-2 ( ISO - Latin - 2 )
Kod iso-8859-2 (zwany też iso-latin-2) nie zawiera wszystkich kaszubskich znaków (patrz: tabela pierwsza) , nie przedstawia to jednak wielkiego problemu w prezentacji kaszubskojęzycznych stron internetowych. Dzięki alternatywnemu zapisowi brakujących znaków (i nie tylko tych) można i w tym html-kodzie przedstawić poprawnie napisane strony kaszubskojęzyczne.
<!DOCTYPE HTML PUBLIC “-//W3C//DTD HTML 4.01 Transitional//EN”>
<html>
<head>
<meta http-equiv=”Content-Type” content=”text/html; charset=iso-8859-2“>
</head>
</html>
Koniec strony
a. Litery spójne z polskimi jak: ą, ł, ń, ó, ż - należy wpisać “normalnie” - z klawiatury
b. Kaszubskie “ogonki” - różniące się od polskich- jak: Ã, ã, É, é, Ë, ë, Ò, ò, Ù, ù jak i wspólną z polskim alfabetem literę Ó , ó.
zapiszcie w HTML tak jak w tabeli drugiej:
Tab. 2 - Alternatywny zapis kaszubskich “ogonków” w html.
| Ã | Ã |
| ã | ã |
| É | É |
| é | é |
| Ë | Ë |
| ë | ë |
| Ò | Ò |
| ò | ò |
| Ó | Ó |
| ó | ó |
| Ù | Ù |
| ù | ù |
Chcecie, na stronie kodowanej w iso-8859-2, napisac : Naji ùczbë
Początek już znacie
<!DOCTYPE HTML PUBLIC “-//W3C//DTD HTML 4.01 Transitional//EN”>
<html>
<head>
<meta http-equiv=”Content-Type” content=”text/html; charset=iso-8859-2″>
<title> Miejsce na tytuł waszej strony</title>
<body>
A tu na wasz tekst, którego zapis będzie wygladał następująco: Naji ùczbë.
</body>
</head>
</html>
Koniec strony
Uwaga ! ! !
Jak czytaliście wyżej (tabela pierwsza) część kaszubskich znaków jest zawarta w tabeli iso-8859-1 (ã, ò, ù) , poprzez to, a może i z innej przyczyny, tak zapisany tekst jest błednie itnterpretowany przez niektóre starsze przeglądarki.
Tak jest napewno z Netscapem i Operą niżej wersji 6.0 .
Zastępowanie znaków kaszubskich nie zawartych w iso-8859-2 zapisem numerycznym unicodu (pominąłem to celowo w tekście) niczego nie zmienia - takie strony są tak samo dla tych przeglądarek nieczytelne, jak te z “zapisem alternatywnym”.
Warto pamiętać !
1. Netscape 4x używany jest jeszcze przez niektórych internautów.
W związku z tym nie polecam publikacji stron kaszubskojęzycznych w kodzie iso-8859-2, jak i w iso-8859-1, którego możliwości zapisu tu celowo pominąłem, choć jest taki też możliwy (zastępowanie nie zawartych w danym kodzie znaków tymi z utf-8 wydaje mi się bardzo niespójne i nielogiczne). Podobnie ma się to też do Opery do wersji 5x.
2. Netscape 4x, 5x podobnie jak i w IE4x do IE 6.0 cechuje “problematyczna” kompatybilność ze standardami ustalonymi przez World Wide Web Consortium. Jedyny wyjątek z rodziny IE stanowi wersja 5.5 i to, żeby bylo śmieszniej, tylko i wyłącznie ta na MAC’a
Uwaga : Standardy są lepsze i nie są wymyślane w celu kopmlikacji, tylko ku poprawie komunikacji w sieci !!!