KOI8-U

KOI8-U
KOI8-U
언어우크라이나어, 러시아어, 불가리아어
분류8비트 KOI, 확장 ASCII
확장KOI8-B
에 기반을 둔KOI8-R
기타 관련 부호화KOI8-RU, KOI8-F

KOI8-U(RFC 2319)는 8비트 문자 인코딩으로 키릴 문자를 사용하는 우크라이나어를 커버하도록 설계되었습니다.러시아어와 불가리아어를 망라KOI8-R을 기반으로 하지만 8개의 상자 그리기 문자를 대소문자와 소문자 모두 4개의 우크라이나 문자 ґ, є, ї로 대체합니다.

KOI8-RU는 밀접한 관련이 있지만 벨라루스어를 위해 belarus를 추가합니다.둘 다 문자 할당은 KOI8-F에 추가된 δ를 제외하고 KOI8-E의 문자 할당과 일치합니다.

Microsoft Windows 에서는, KOI8-U 에 코드 페이지 번호 21866 이 할당됩니다.IBM에서는 KOI8-U에 코드 페이지/CCSID 1168이 [1][2][3]할당됩니다.

KOI8은 ISO 8859-5보다 훨씬 더 일반적으로 사용되고 있으며, 이는 실제로 인기를 끌지 못했습니다.또 다른 일반적인 키릴 문자 인코딩은 Windows-1251입니다.미래에는 둘 다 결국 유니코드에 자리를 내줄지도 모른다.

KOI8은 Kod Obmena Informatsiey, 8bit의 약자로, "Code for Information Exchange, 8bit"를 의미합니다.

KOI8 문자 집합은 ISO 8859-5와 같이 러시아 키릴 문자는 자연 키릴 문자의 알파벳 순서가 아니라 의사 로마자의 순서라는 특성을 가지고 있다.이것은 부자연스럽게 보일 수 있지만, 8비트가 제거되어도 일반 ASCII 단말기에서 대소문자를 역번역했을 경우 텍스트를 읽을 수 있는(또는 적어도 해독할 수 있는) 유용한 속성이 있습니다.예를 들어 8비트가 제거되면 KOI8-U의 "Russian Text"가 rUSSKIJ tEKST("러시아어 텍스트")가 됩니다.

문자 집합

다음 표에 KOI8-U [1][4]인코딩을 나타냅니다.각 문자는 대응하는 Unicode 코드 포인트와 함께 표시됩니다.

KOI8-U
0 1 2 3 4 5 6 7 8 9 A B C D E F
0x
1배
2배 SP ! " # $ % & ' ( ) * + , - . /
3배 0 1 2 3 4 5 6 7 8 9 : ; < > = > ?
4배 @ A B C D E F G H I J K L M N O
5배 P Q R S T U V W X Y Z [ \ ] ^ _
6배 ` a b c d e f g h i j k l m n o
7배 p q r s t u v w x y z { } ~
8배
2500

2502

250도

2510

2514

2518

251C

2524

252C

2534

253C

2580

2584

2588

258C

2590
9배
2591

2592

2593

2320

25A0

2219

221A

2248

2264

2265
NBSP
2321
°
00B0
²
00B2
·
00B7
÷
00F7
도끼
2550

2551

2552
ё
0451
є
0454

2554
і
0456
ї
0457

2557

2558

2559

255A

255B
ґ
0491

255D

255E
Bx
255F

2560

2561
Ё
0401
Є
0404

2563
І
0406
Ї
0407

2566

2567

2568

2569

256A
Ґ
0490

256C
©
00A9
Cx ю
044E
а
0430
б
0431
ц
0446
д
0434
е
0435
ф
0444
г
0433
х
0445
и
0438
й
0439
к
043A
л
043B
м
043C
н
043D
о
043E
Dx п
043F
я
044F
р
0440
с
0441
т
0442
у
0443
ж
0436
в
0432
ь
044C
ы
044B
з
0437
ш
0448
э
044D
щ
0449
ч
0447
ъ
044A
Ю
042E
А
0410
Б
0411
Ц
0426
Д
0414
Е
0415
Ф
0424
Г
0413
Х
0425
И
0418
Й
0419
К
041A
Л
041B
М
041C
Н
041D
О
041E
Fx П
041F
Я
042F
Р
0420
С
0421
Т
0422
У
0423
Ж
0416
В
0412
Ь
042C
Ы
042B
З
0417
Ш
0428
Э
042D
Щ
0429
Ч
0427
Ъ
042A
KOI8-R과의 차이점(러시아어 이외의 문자)

RFC 2319에서는 문자 0x95는 U+2219( ()로 되어 있습니다만, Windows-1251 에서는 글머리 기호와 일치하도록 U+2022(•)로 되어 있는 경우도 있습니다.

일부 레퍼런스에는 오타가 있어 문자 0xB4가 올바른 U+0404가 아닌 U+0403이라고 잘못 기재되어 있습니다.이 오타는 RFC 2319의 부록A에 기재되어 있습니다(단, RFC 본문의 표는 올바른 매핑을 나타내고 있습니다).

「 」를 참조해 주세요.

레퍼런스

  1. ^ a b "SBCS code page information - CPGID: 01168 / Name: Ukrainian KOI8-U". IBM Software: Globalization: Coded character sets and related resources: Code pages by CPGID: Code page identifiers. IBM. C-H 3-3220-050. Archived from the original on 2017-02-18. Retrieved 2017-02-18. [1] [2]
  2. ^ "CCSID information document; CCSID 1168; KOI8-U". IBM. Archived from the original on 2017-02-18. Retrieved 2017-02-18.
  3. ^ International Components for Unicode (ICU), ibm-1168_P100-2002.ucm, 2002-12-03
  4. ^ Verdy, Philippe; Richter, Helmut (2016-01-04) [2008-10-13]. "KOI8-U.TXT". 2.0. Retrieved 2016-12-09.{{cite web}}: CS1 maint :url-status (링크)

추가 정보

외부 링크