본문 바로가기
프로그래밍/언어처리

CJK 유니코드

by 베리베리 2009. 6. 24.

Unicode#



UTF-8 인코딩에서 각 언어별 표현 영역#
UTF-8 인코딩에서 한글을 표현하는 영역#
Block Unicode code UTF-8 Hex    비          고  
Hangul Jamo U+1100 ~ U+11FF 0xE1 0x84 0x80 ~ 0xE1 0x87 0xBF 한글자모
Hangul Compatibility Jamo U+3130 ~ U+318F 0xE3 0x84 0xB0 ~ 0xE3 0x86 0x8F 한글호환자모
Hangul Syllables U+AC00 ~ U+D7AF 0xEA 0xB0 0x81 ~ 0xED 0x9E 0xA3 한글

UTF-8 인코딩에서 일본어를 표현하는 영역#
Block Unicode code UTF-8 Hex    비          고  
Hiragana U+3040 ~ U+309F 0xE3 0x81 0x81 ~ 0xE3 0x82 0x9F 일본어 히라가나
Katakana U+30A0 ~ U+30FF 0xE3 0x82 0xA0 ~ 0xE3 0x83 0xBF 일본어 카타카나

UTF-8 인코딩에서 한중일 한자를 표현하는 영역#
Block Unicode code UTF-8 Hex    비          고
CJK Unified Ideographs U+4E00 ~ U+9FFF 0xE4 0xB8 0x80 ~ 0xE9 0xBF 0xBF 한중일 공통 한자
CJK Unified Ideographs Extension A U+3400 ~ U+4DBF 0xE3 0x90 0x80 ~ 0xE4 0xB6 0xBF 한자 확장 A
CJK Unified Ideographs Extension B U+20000 ~ U+2A6DF 0xF0 0xA0 0x80 0x80 ~ 0xF0 0xAA 0x9B 0x9F 한자 확장 B
CJK Compatibility Ideographs U+F900 ~ U+FAFF 0xEF 0xA4 0x89 ~ 0xEF 0xAB 0xBF 한중일 호환 한자

History

Last edited on Jun 16, 2009 22:09 by 휘슬

댓글