본문 바로가기

프로그래밍/언어처리6

CJK 유니코드 Unicode# Unicode offical site - http://unicode.org Wikipedia - http://en.wikipedia.org/wiki/Summary_of_Unicode_character_assignments UTF-8 encoding table : http://www.utf8-chartable.de/unicode-utf8-table.pl View Unicode Characters : Link1, Link2 UTF-8 인코딩에서 각 언어별 표현 영역# UTF-8 인코딩에서 한글을 표현하는 영역# Block Unicode code UTF-8 Hex 비 고 Hangul Jamo U+1100 ~ U+11FF 0xE1 0x84 0x80 ~ 0xE1 0x87 0xBF 한글자모 Hang.. 2009. 6. 24.
KSC5601-1987 한글코드 총 2350자 KSC5601-1987 한글코드 총 2350자 한 글 코드 대역 ------------------- 가~괆 B0A1~B0FE 괌~깸 B1A1~B1FE 깹~끙 B2A1~B2FE 끝~뇝 B3A1~B3FE 뇟~덥 B4A1~B4FE 덧~딸 B5A1~B5FE 땀~랗 B6A1~B6FE 래~륩 B7A1~B7FE 륫~뫼 B8A1~B8FE 묀~벗 B9A1~B9FE 벙~빤 BAA1~BAFE 빨~샤 BBA1~BBFE 샥~숭 BCA1~BCFE 숯~쐰 BDA1~BDFE 쐴~엎 BEA1~BEFE 에~웨 BFA1~BFFE 웩~젊 C0A1~C0FE 점~짓 C1A1~C1FE 징~찻 C2A1~C2FE 찼~층 C4A1~C4FE 치~퉜 C5A1~C5FE 퉤~퐁 C6A1~C6FE 퐈~혠 C7A1~C7FE 혤~힝 C8A1~C8FE 한 글 코드.. 2009. 6. 23.
IE의 언어자동선택 때문에 META CONTENT-TYPE CHARSET 지정이 먹지 않는 문제 출처: http://mwultong.blogspot.com/2006/01/bloggercom.html 이 버그는 IE의 인코딩을 "자동 선택"으로 해 둔 상태에서 대부분 일어난다. IE가, 블로그의 인코딩을 UTF-8 이 아닌 euc-kr 로 오인하고 있었다. ('블로거'의 기본 인코딩은 UTF-8이다. 그러나 인코딩을 euc-kr로 해도 이 버그가 나타나는 경우가 있었다.) 그런데 이유는 아무리 찾아봐도 알 수가 없었다. 다만 파이어폭스에서는 이 버그가 나타나지 않았다. 보름 넘게 이 문제 때문에 고민하고 있었다. 템플릿과 HTML 소스를 아무리 분석해 봐도 알 수가 없었다. 일본어 사이트에서도 이런 경우가 드물지 않았다. 일본 네티즌들이 해결책을 올려놓았는데 실제 해보니 버그가 전혀 해결되지 않았다... 2009. 1. 1.
일본한자 <-> 한국한자 (변환테이블) 이 글은 퍼온것입니다. 출처: http://mwultong.blogspot.com/2006/01/japanese-kanji-korean-hanja-convert.html ------------------------------- 일본식 한자 (Shift-JIS Code) 에, 대응하는 한국식 한자 (euc-kr Code) 를, 도표로 만들었습니다. 다만, 한국식 한자로 변환할 수 없는 한자들은, Microsoft Word 의 한자음을 참고하여, 한글로 음을 표기했습니다. 이 한자 데이터는 원래 "일한 한자 변환기 자바 스크립트 (IE 전용)" 안에 있는 내용인데, 제가 몇 글자를 추가했습니다. ===== 日 韓 ----- 亜 亞 唖 啞 悪 惡 圧 壓 囲 圍 為 爲 医 醫 壱 壹 稲 稻 飲 飮 隠 隱 嘘 噓.. 2009. 1. 1.