Lubię wiedzieć

Blog, który odpowie na twoje pytania

Kodowanie polskich znaków w Unicode

Unicode polskie znaki

Unicode jest standardem kodowania komputerowego, reprezentacji i przygotowania tekstu. Znalazł zastosowanie w większości światowych systemów pisma używanych na świecie. Opracowany został we współpracy ze standardem Universal Character Set i opublikowany w formie książkowej ("Standard Unikod"). Najnowsza wersja unikodu zawiera zestaw ponad 110000 znaków obejmujących 100 skryptów.

Norma składa się z tabeli, w których przedstawiono kod oraz jego wizualne odniesienie. W opisie znajduje się też metodologia kodowania i zestaw standardowych znaków, zestaw plików komputerowych, danych referencyjnych, a także szereg powiązanych elementów, takich jak właściwości znaku, zasady normalizacji, rozkładu, zestawiania, rendering i dwukierunkowa kolejność wyświetlania (dla tekstu zawierającego zarówno skrypty pisane od prawej do lewej, jak i arabskie oraz hebrajskie, pisane od lewej do prawej).

Unicode zunifikował zestawy znaków, co doprowadziło do jego szerokiego zastosowania, a w konsekwencji do internacjonalizacji i lokalizacji oprogramowania komputerowego. Standard ten został wdrożony w wielu najnowszych technologiach, m. in. w nowoczesnych systemach operacyjnych, XML, języku programowania Java oraz Microsoft. NET Framework. Unicode może być używany w różnych kodowaniach znaków (np. UTF-8, ISO 8859-2).

Polskie znaki diakrytyczne w Unikodzie

W języku polskim znajduje się 9 liter diakrytycznych (powstałych przy użyciu znaków diakrytycznych): ą, ć, ę, ł, ń, ó, ś, ź, ż. Żeby treści pisane w naszym języku były czytelne na stronie internetowej, musimy zamienić polskie litery na odpowiednie znaki w standardzie ISO 8859-2 lub UTF-8. Nic nie stoi na przeszkodzie, żeby wprowadzać te litery ręcznie. Wówczas pomocna może okazać się poniższa tabela.

LiteraKod heksadecymalnyKod dziesiętny
ą

ą

ą

ć

ć

ć

ę

ę

ę

ł

ł

ł

ń

ń

ń

ó

ó

ó

ś

ś

ś

ź

ź

ź

ż

ż

ż

Ą

Ą

Ą

Ć

Ć

Ć

Ę

Ę

Ę

Ł

Ł

Ł

Ń

Ń

Ń

Ó

Ó

Ó

Ś

Ś

Ś

Ź

Ź

Ź

Ż

Ż

Ż

„

„

”

”

Zamiast ręcznego wstawiania znaków, można (a nawet jest to wskazane) skorzystać z odpowiednich programów. Niektóre są płatne, ale w Sieci znajdziemy również wiele darmowych aplikacji.


Pomóż innym znaleźć ten artykuł:


Polecamy:
Tani hosting

Ta strona została znaleziona m. in. przez następujące frazy: unikod polskie znaki, unicode polskie znaki, polskie znaki w unicode, kodowanie polskich znaków, utf-8 polskie znaki kody, utf-8 polskie znaki html, kodowanie polskich znaków utf-8 html, kodowanie polskich znaków html, kodowanie polskich znaków php.