반각 및 전각 형식
Halfwidth and fullwidth formsCJK 컴퓨팅에서 그래픽 문자는 전통적으로 전각(대만 및 홍콩: 全), CJK: 全, 반각(대만 및 홍콩: 形, CJK: )) 문자로 분류됩니다.단축 글꼴과 달리 반각 문자는 전각 문자의 반각 문자의 반을 차지하기 때문에 이름이 붙여집니다.
Halfwidth 및 Fullwidth Forms는 Unicode 블록 U+FF00–FFEF의 이름이기도 합니다.단, 반각 및 전각 문자를 모두 포함한 오래된 인코딩은 Unicode와의 무손실 변환을 할 수 있습니다.
근거
텍스트 모드 컴퓨팅의 시대에는 서양 문자는 보통 화면상의 그리드에 배치되어 있었습니다.대부분 80열, 24줄 또는 25줄로 배열되어 있었습니다.각 문자는 대개 8픽셀 폭의 작은 도트 매트릭스로 표시되며, 일반적으로 SBCS(싱글 바이트 문자 집합)를 사용하여 서양 언어의 문자를 인코딩했습니다.
심미적 이유와 가독성을 위해 한자는 대략 정사각형 모양이며, 따라서 고정된 너비의 SBCS 문자보다 두 배 더 넓은 것이 바람직하다.이는 일반적으로 DBCS(더블바이트 문자 집합)로 인코딩되기 때문에 화면의 너비가 바이트 길이에 비례한다는 의미이기도 합니다.일부 단말기와 편집 프로그램은 홀수 열로 시작하는 더블바이트 문자를 처리할 수 없었습니다. 단 1개(더블바이트와 싱글바이트 문자를 같은 줄에 넣을 수도 없었습니다).따라서 DBCS 세트에는 일반적으로 같은 줄에 있는 CJK 문자와 함께 사용할 수 있도록 로마자와 숫자도 포함되어 있습니다.
한편, 초기의 일본 컴퓨팅에서는, 가타카나에 JIS X 0201이라고 하는 싱글 바이트 코드 페이지를 사용했습니다.이들은 다른 싱글바이트 문자와 같은 너비로 렌더링되며, 보통 비례 가나 문자가 아닌 반각 가나 문자가 됩니다.JIS X 0201 규격 자체는 가타카나의 반폭 표시를 규정하지 않았지만, 이것은 Shift JIS에서 싱글 바이트 JIS X 0201과 더블 바이트 JIS X 0208 가타카나를 시각적으로 구별하는 기능이 되었습니다.일부 IBM 코드 페이지는 N바이트 한글 코드와 EBCDIC 번역에 기초한 한국어 자모에 [1]대해 유사한 처리를 사용했습니다.
유니코드
Unicode는 동일한 문자의 반각 및 전각 버전을 모두 포함하는 기존 문자 집합과의 호환성을 위해 필요한 "대체 너비" 문자를 포함하는 단일 블록을 U+FF00 – FFEF에 할당했습니다.여기에는 모든 ASCII 문자의 전체 너비 버전과 일부 비 ASCII 문장 부호(예: Yen 기호), 가타카나 및 한글의 절반 너비 버전 및 원과 같은 다른 일부 기호의 절반 너비 버전이 포함됩니다.기존 문자 집합으로의 무손실 라운드 트립에 필요한 문자만 할당되었으며, 모든 라틴 악센트 문자의 전체 너비 버전을 만드는 것이 아닙니다.
Unicode는 모든 코드 포인트에 "동아시아 너비" 속성을 할당합니다.다음과 [2]같은 경우가 있습니다.
줄임말 | 이름. | 묘사 |
---|---|---|
W | 넓은 | 히라가나 등 자연스럽게 넓은 캐릭터. |
나 | 좁은 | ISO Basic Latin 알파벳과 같이 자연스럽게 좁은 문자입니다. |
F | 전폭 | 자연스럽게 좁은 문자로의 호환성 정규화를 수반하는 와이드 바리안트(전폭 라틴어 스크립트 등). |
H | 반폭 | 자연히 넓은 문자(예: 반각 가나)에 대한 호환성 정규화를 수반하는 좁은 변형.예외로서 U+20A9())를 포함합니다. |
A | 애매하다 | 동아시아 DBCS 코드뿐만 아니라 유럽 SBCS 코드(예: 그리스어 알파벳)에 포함된 문자.따라서 이중화된 행동은 다양할 수 있습니다. |
N | 중립 | 동아시아 DBCS 코드에 표시되지 않는 문자(예: Devanagari). |
터미널 에뮬레이터는 이 속성을 사용하여 탭과 커서 위치를 확인할 때 문자가 하나 또는 두 개의 "열"을 사용해야 하는지 여부를 결정할 수 있습니다.
OpenType에서
OpenType에는 "fwid", "halt", "hwid" 및 "vhal" 기능 태그가 있으며,[citation needed] 전폭 또는 반폭 문자를 제공하기 위해 사용됩니다.
「 」를 참조해 주세요.
- 한통일
- 동아시아 구두점
- Em 사이즈 – 전폭 폼
- 한글 자모(유니코드 블록)
- 가타카나(유니코드 블록)
- 유니코드의 라틴어 스크립트
- 동봉된 영숫자 – 글머리 기호 시퀀스. 일부는 전폭으로 표시됩니다(예: ", ", ", ", ", " 등).
레퍼런스
- ^ "ICU Demonstration - Converter Explorer". demo.icu-project.org. Retrieved 7 May 2018.
- ^ Lunde, Ken (2019-01-25). "Unicode® Standard Annex #11: East Asian Width". Unicode Consortium.
외부 링크
- 동아시아 폭 유니코드 표준 부속서 11호