Unicode#
- Unicode offical site - http://unicode.org
- Wikipedia - http://en.wikipedia.org/wiki/Summary_of_Unicode_character_assignments
- UTF-8 encoding table : http://www.utf8-chartable.de/unicode-utf8-table.pl
UTF-8 인코딩에서 각 언어별 표현 영역#
UTF-8 인코딩에서 한글을 표현하는 영역#
Block | Unicode code | UTF-8 Hex | 비 고 |
---|---|---|---|
Hangul Jamo | U+1100 ~ U+11FF | 0xE1 0x84 0x80 ~ 0xE1 0x87 0xBF | 한글자모 |
Hangul Compatibility Jamo | U+3130 ~ U+318F | 0xE3 0x84 0xB0 ~ 0xE3 0x86 0x8F | 한글호환자모 |
Hangul Syllables | U+AC00 ~ U+D7AF | 0xEA 0xB0 0x81 ~ 0xED 0x9E 0xA3 | 한글 |
UTF-8 인코딩에서 일본어를 표현하는 영역#
Block | Unicode code | UTF-8 Hex | 비 고 |
---|---|---|---|
Hiragana | U+3040 ~ U+309F | 0xE3 0x81 0x81 ~ 0xE3 0x82 0x9F | 일본어 히라가나 |
Katakana | U+30A0 ~ U+30FF | 0xE3 0x82 0xA0 ~ 0xE3 0x83 0xBF | 일본어 카타카나 |
UTF-8 인코딩에서 한중일 한자를 표현하는 영역#
Block | Unicode code | UTF-8 Hex | 비 고 |
---|---|---|---|
CJK Unified Ideographs | U+4E00 ~ U+9FFF | 0xE4 0xB8 0x80 ~ 0xE9 0xBF 0xBF | 한중일 공통 한자 |
CJK Unified Ideographs Extension A | U+3400 ~ U+4DBF | 0xE3 0x90 0x80 ~ 0xE4 0xB6 0xBF | 한자 확장 A |
CJK Unified Ideographs Extension B | U+20000 ~ U+2A6DF | 0xF0 0xA0 0x80 0x80 ~ 0xF0 0xAA 0x9B 0x9F | 한자 확장 B |
CJK Compatibility Ideographs | U+F900 ~ U+FAFF | 0xEF 0xA4 0x89 ~ 0xEF 0xAB 0xBF | 한중일 호환 한자 |
History
Last edited on Jun 16, 2009 22:09 by 휘슬
댓글