CP932
Code Page 932, czyli strona kodowa 932, znane także jako Windows-31J jest rozszerzeniem kodowania Shift_JIS opracowanym przez firmę Microsoft, by zawierało znaki specjalne NEC (rząd 13.), wybór NEC rozszerzeń IBM (rzędy 89–92) i rozszerzenia IBM (rzędy 115–119). Kodowanymi zestawami znaków są JIS X0201:1997, JIS X0208:1997 i powyższe rozszerzenia. Zarejestrowaną nazwą IANA dla tego kodowania jest Windows-31J.
Tablica kodów
[edytuj | edytuj kod]Poniższa tabela przedstawia znaki i ich szesnastkowe kody w CP932. Przedstawione są znaki tylko z zakresu 0x0–0xFF. Całe kodowanie zawiera w sumie 7980 znaków. Zorganizowane są one względem bajta prowadzącego, w swego rodzaju przedziały, w których znaki są zbudowane według schematu: <bajt prowadzący><kod znaku>. Przykładowo znak o kodzie 0x82D7 (bajt prowadzący: 0x82; kod znaku: 0xD7) odpowiada U+3079 (HIRAGANA LETTER BE, べ) w Unikodzie.
CP932 | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | xA | xB | xC | xD | xE | xF | |
0x | Znaki kontrolne | |||||||||||||||
1x | ||||||||||||||||
2x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | ZK |
8x | NZ | Bajt prowadzący kodowania dwubajtowego | ||||||||||||||
9x | ||||||||||||||||
Ax | NZ | 。 | 「 | 」 | 、 | ・ | ヲ | ァ | ィ | ゥ | ェ | ォ | ャ | ュ | ョ | ッ |
Bx | ー | ア | イ | ウ | エ | オ | カ | キ | ク | ケ | コ | サ | シ | ス | セ | ソ |
Cx | タ | チ | ツ | テ | ト | ナ | ニ | ヌ | ネ | ノ | ハ | ヒ | フ | ヘ | ホ | マ |
Dx | ミ | ム | メ | モ | ヤ | ユ | ヨ | ラ | リ | ル | レ | ロ | ワ | ン | ゙ | ゚ |
Ex | Bajt prowadzący kodowania dwubajtowego | |||||||||||||||
Fx | NZ | NZ | NZ | NZ |
W powyższej tabeli, znak o kodzie 0x20 jest zwykłą spacją.
„ZK” oznacza znak kontrolny, a „NZ” oznacza znak niezdefiniowany przez standard.
Mapowanie na Unicode
[edytuj | edytuj kod]Poniższa tabela przedstawia miejsca znaków z zakresu 0x80–0xFF z CP932 w Unicode.
CP932 | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Hex | Znak | Unicode | Hex | Znak | Unicode | Hex | Znak | Unicode | Hex | Znak | Unicode |
0x80 | NZ | 0xA0 | NZ | 0xC0 | タ | U+FF80 | 0xE0 | DBCSLB | |||
0x81 | DBCSLB | 0xA1 | 。 | U+FF61 | 0xC1 | チ | U+FF81 | 0xE1 | DBCSLB | ||
0x82 | DBCSLB | 0xA2 | 「 | U+FF62 | 0xC2 | ツ | U+FF82 | 0xE2 | DBCSLB | ||
0x83 | DBCSLB | 0xA3 | 」 | U+FF63 | 0xC3 | テ | U+FF83 | 0xE3 | DBCSLB | ||
0x84 | DBCSLB | 0xA4 | 、 | U+FF64 | 0xC4 | ト | U+FF84 | 0xE4 | DBCSLB | ||
0x85 | DBCSLB | 0xA5 | ・ | U+FF65 | 0xC5 | ナ | U+FF85 | 0xE5 | DBCSLB | ||
0x86 | DBCSLB | 0xA6 | ヲ | U+FF66 | 0xC6 | ニ | U+FF86 | 0xE6 | DBCSLB | ||
0x87 | DBCSLB | 0xA7 | ァ | U+FF67 | 0xC7 | ヌ | U+FF87 | 0xE7 | DBCSLB | ||
0x88 | DBCSLB | 0xA8 | ィ | U+FF68 | 0xC8 | ネ | U+FF88 | 0xE8 | DBCSLB | ||
0x89 | DBCSLB | 0xA9 | ゥ | U+FF69 | 0xC9 | ノ | U+FF89 | 0xE9 | DBCSLB | ||
0x8A | DBCSLB | 0xAA | ェ | U+FF6A | 0xCA | ハ | U+FF8A | 0xEA | DBCSLB | ||
0x8B | DBCSLB | 0xAB | ォ | U+FF6B | 0xCB | ヒ | U+FF8B | 0xEB | DBCSLB | ||
0x8C | DBCSLB | 0xAC | ャ | U+FF6C | 0xCC | フ | U+FF8C | 0xEC | DBCSLB | ||
0x8D | DBCSLB | 0xAD | ュ | U+FF6D | 0xCD | ヘ | U+FF8D | 0xED | DBCSLB | ||
0x8E | DBCSLB | 0xAE | ョ | U+FF6E | 0xCE | ホ | U+FF8E | 0xEE | DBCSLB | ||
0x8F | DBCSLB | 0xAF | ッ | U+FF6F | 0xCF | マ | U+FF8F | 0xEF | DBCSLB | ||
0x90 | DBCSLB | 0xB0 | ー | U+FF70 | 0xD0 | ミ | U+FF90 | 0xF0 | DBCSLB | ||
0x91 | DBCSLB | 0xB1 | ア | U+FF71 | 0xD1 | ム | U+FF91 | 0xF1 | DBCSLB | ||
0x92 | DBCSLB | 0xB2 | イ | U+FF72 | 0xD2 | メ | U+FF92 | 0xF2 | DBCSLB | ||
0x93 | DBCSLB | 0xB3 | ウ | U+FF73 | 0xD3 | モ | U+FF93 | 0xF3 | DBCSLB | ||
0x94 | DBCSLB | 0xB4 | エ | U+FF74 | 0xD4 | ヤ | U+FF94 | 0xF4 | DBCSLB | ||
0x95 | DBCSLB | 0xB5 | オ | U+FF75 | 0xD5 | ユ | U+FF95 | 0xF5 | DBCSLB | ||
0x96 | DBCSLB | 0xB6 | カ | U+FF76 | 0xD6 | ヨ | U+FF96 | 0xF6 | DBCSLB | ||
0x97 | DBCSLB | 0xB7 | キ | U+FF77 | 0xD7 | ラ | U+FF97 | 0xF7 | DBCSLB | ||
0x98 | DBCSLB | 0xB8 | ク | U+FF78 | 0xD8 | リ | U+FF98 | 0xF8 | DBCSLB | ||
0x99 | DBCSLB | 0xB9 | ケ | U+FF79 | 0xD9 | ル | U+FF99 | 0xF9 | DBCSLB | ||
0x9A | DBCSLB | 0xBA | コ | U+FF7A | 0xDA | レ | U+FF9A | 0xFA | DBCSLB | ||
0x9B | DBCSLB | 0xBB | サ | U+FF7B | 0xDB | ロ | U+FF9B | 0xFB | DBCSLB | ||
0x9C | DBCSLB | 0xBC | シ | U+FF7C | 0xDC | ワ | U+FF9C | 0xFC | NZ | ||
0x9D | DBCSLB | 0xBD | ス | U+FF7D | 0xDD | ン | U+FF9D | 0xFD | NZ | ||
0x9E | DBCSLB | 0xBE | セ | U+FF7E | 0xDE | ゙ | U+FF9E | 0xFE | NZ | ||
0x9F | DBCSLB | 0xBF | ソ | U+FF7F | 0xDF | ゚ | U+FF9F | 0xFF | NZ |
„DBCSLB” oznacza bajt prowadzący kodowania dwubajtowego (ang. Double Byte Character Set Lead Byte).
Linki zewnętrzne
[edytuj | edytuj kod]- Windows Codepage 932. Microsoft. [dostęp 2006-01-02]. [zarchiwizowane z tego adresu (2009-02-04)]. (ang.).
- cp932 to Unicode table. Unicode.org.