Windows-1251
Windows-1251 jest 8–bitowym kodowaniem znaków, zaprojektowanym do pokrycia języków używających cyrylicy, takich jak język rosyjski i inne. Kodowanie to jest najczęściej używane dla języka bułgarskiego[potrzebny przypis].
Windows-1251 i KOI8-R (lub ukraiński wariant: KOI8-U) są o wiele częściej używane niż ISO 8859-5, które nigdy nie zyskało dużej popularności. Obecnie, wszystkie te zestawy znaków, są coraz częściej zastępowane przez Unicode.
Tablica kodów
[edytuj | edytuj kod]Poniższa tabela przedstawia znaki i ich szesnastkowe kody w Windows-1251.
x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | xA | xB | xC | xD | xE | xF | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0x | Znaki kontrolne | |||||||||||||||
1x | ||||||||||||||||
2x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | Przecinek, | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | ZK |
8x | Ђ | Ѓ | ‚ | ѓ | „ | … | † | ‡ | € | ‰ | Љ | ‹ | Њ | Ќ | Ћ | Џ |
9x | ђ | ‘ | ’ | “ | ” | • | – | — | NZ | ™ | љ | › | њ | ќ | ћ | џ |
Ax | NBSP | Ў | ў | Ј | ¤ | Ґ | ¦ | § | Ё | © | Є | « | ¬ | SHY | ® | Ї |
Bx | ° | ± | І | і | ґ | µ | ¶ | · | ё | № | є | » | ј | Ѕ | ѕ | ї |
Cx | А | Б | В | Г | Д | Е | Ж | З | И | Й | К | Л | М | Н | О | П |
Dx | Р | С | Т | У | Ф | Х | Ц | Ч | Ш | Щ | Ъ | Ы | Ь | Э | Ю | Я |
Ex | а | б | в | г | д | е | ж | з | и | й | к | л | м | н | о | п |
Fx | р | с | т | у | ф | х | ц | ч | ш | щ | ъ | ы | ь | э | ю | я |
Gdzie „NZ” oznacza znak niezdefiniowany w kodowaniu, a „ZK” oznacza znak kontrolny.
W powyższej tabeli znak o kodzie 0x20 to zwykła spacja, 0xA0 to twarda spacja, a znak 0xAD to miękki dywiz.
Mapowanie na Unicode
[edytuj | edytuj kod]Poniższa tabela przedstawia miejsca znaków z Windows-1251 w Unicode.
Hex | Znak | Unicode | Hex | Znak | Unicode | Hex | Znak | Unicode | Hex | Znak | Unicode |
---|---|---|---|---|---|---|---|---|---|---|---|
0x80 | Ђ | U+0402 | 0xA0 | NBSP | U+00A0 | 0xC0 | А | U+0410 | 0xE0 | а | U+0430 |
0x81 | Ѓ | U+0403 | 0xA1 | Ў | U+040E | 0xC1 | Б | U+0411 | 0xE1 | б | U+0431 |
0x82 | ‚ | U+201A | 0xA2 | ў | U+045E | 0xC2 | В | U+0412 | 0xE2 | в | U+0432 |
0x83 | ѓ | U+0453 | 0xA3 | Ј | U+0408 | 0xC3 | Г | U+0413 | 0xE3 | г | U+0433 |
0x84 | „ | U+201E | 0xA4 | ¤ | U+00A4 | 0xC4 | Д | U+0414 | 0xE4 | д | U+0434 |
0x85 | … | U+2026 | 0xA5 | Ґ | U+0490 | 0xC5 | Е | U+0415 | 0xE5 | е | U+0435 |
0x86 | † | U+2020 | 0xA6 | ¦ | U+00A6 | 0xC6 | Ж | U+0416 | 0xE6 | ж | U+0436 |
0x87 | ‡ | U+2021 | 0xA7 | § | U+00A7 | 0xC7 | З | U+0417 | 0xE7 | з | U+0437 |
0x88 | € | U+20AC | 0xA8 | Ё | U+0401 | 0xC8 | И | U+0418 | 0xE8 | и | U+0438 |
0x89 | ‰ | U+2030 | 0xA9 | © | U+00A9 | 0xC9 | Й | U+0419 | 0xE9 | й | U+0439 |
0x8A | Љ | U+0409 | 0xAA | Є | U+0404 | 0xCA | К | U+041A | 0xEA | к | U+043A |
0x8B | ‹ | U+2039 | 0xAB | « | U+00AB | 0xCB | Л | U+041B | 0xEB | л | U+043B |
0x8C | Њ | U+040A | 0xAC | ¬ | U+00AC | 0xCC | М | U+041C | 0xEC | м | U+043C |
0x8D | Ќ | U+040C | 0xAD | SHY | U+00AD | 0xCD | Н | U+041D | 0xED | н | U+043D |
0x8E | Ћ | U+040B | 0xAE | ® | U+00AE | 0xCE | О | U+041E | 0xEE | о | U+043E |
0x8F | Џ | U+040F | 0xAF | Ї | U+0407 | 0xCF | П | U+041F | 0xEF | п | U+043F |
0x90 | ђ | U+0452 | 0xB0 | ° | U+00B0 | 0xD0 | Р | U+0420 | 0xF0 | р | U+0440 |
0x91 | ‘ | U+2018 | 0xB1 | ± | U+00B1 | 0xD1 | С | U+0421 | 0xF1 | с | U+0441 |
0x92 | ’ | U+2019 | 0xB2 | І | U+0406 | 0xD2 | Т | U+0422 | 0xF2 | т | U+0442 |
0x93 | “ | U+201C | 0xB3 | і | U+0456 | 0xD3 | У | U+0423 | 0xF3 | у | U+0443 |
0x94 | ” | U+201D | 0xB4 | ґ | U+0491 | 0xD4 | Ф | U+0424 | 0xF4 | ф | U+0444 |
0x95 | • | U+2022 | 0xB5 | µ | U+00B5 | 0xD5 | Х | U+0425 | 0xF5 | х | U+0445 |
0x96 | – | U+2013 | 0xB6 | ¶ | U+00B6 | 0xD6 | Ц | U+0426 | 0xF6 | ц | U+0446 |
0x97 | – | U+2014 | 0xB7 | · | U+00B7 | 0xD7 | Ч | U+0427 | 0xF7 | ч | U+0447 |
0x98 | NZ | 0xB8 | ё | U+0451 | 0xD8 | Ш | U+0428 | 0xF8 | ш | U+0448 | |
0x99 | ™ | U+2122 | 0xB9 | № | U+2116 | 0xD9 | Щ | U+0429 | 0xF9 | щ | U+0449 |
0x9A | љ | U+0459 | 0xBA | є | U+0454 | 0xDA | Ъ | U+042A | 0xFA | ъ | U+044A |
0x9B | › | U+203A | 0xBB | » | U+00BB | 0xDB | Ы | U+042B | 0xFB | ы | U+044B |
0x9C | њ | U+045A | 0xBC | ј | U+0458 | 0xDC | Ь | U+042C | 0xFC | ь | U+044C |
0x9D | ќ | U+045C | 0xBD | Ѕ | U+0405 | 0xDD | Э | U+042D | 0xFD | э | U+044D |
0x9E | ћ | U+045B | 0xBE | ѕ | U+0455 | 0xDE | Ю | U+042E | 0xFE | ю | U+044E |
0x9F | џ | U+045F | 0xBF | ї | U+0457 | 0xDF | Я | U+042F | 0xFF | я | U+044F |