유니코드

변정용 교수 컴퓨터공학과l승인2018.11.27 16:46

크게

작게

메일

인쇄

신고

유니코드

 

▲ 변정용 교수 컴퓨터공학과

전 세계 모든 언어
일관성 있게
표현할 수 있도록 설계


우리가 대학에 오면서 학생들은 학번을, 교수와 직원은 교번을 받게 된다. 이름은 대학 내에서 동명이인이 있을 수 있기에 학번과 교번은 나를 유일하게 식별시켜주는 코드 역할을 한다. 대학에서 학생, 교수, 직원이 관리 대상이라면 컴퓨터에서는 정보와 자료를 이루는 문자이며 이를 유일하게 식별시켜 주는 게 문자코드이다. 현재 컴퓨터는 미국 표준국(ANSI)에서 제정한 정보교환용 미국표준코드인 아스키(ASCII)를 사용하고 있으며, 국제표준에선 ISO/IEC 646이라 한다. 기술적으로 문자들은 1 바이트(8비트)로 표현되며 앞 4비트(16개)와 뒤 4비트(16개) 구조로 된 16열16행의 아스키 표에 총 256개 문자를 표시한다. 컴퓨터가 다루는 문자는 제어문자와 도형문자라는 두 종류가 있다. 아스키 표에서 앞 4비트는 배정될 문자종류를 구분하는데 0번 - 1번열에 자판에 있는 엔터, 백스페이스, 삭제(del) 등 조작기능을 하는 제어문자를 배정하고, 2번열에서 7번열까지 특수문자, 숫자, 로마자 대문자, 로마자 소문자를 배정한다. 8번과 9번열은 비워두고 10번열에서 15번열까지 94개는 도형문자구역으로 한글은 여기에 배정될 수 있다. 그런데 한글맞춤법에 따른 한글음절은 11172음절로 94보다 매우 크다. 그래서 1987년 2 바이트 행정전산망용 코드는 8859(94 x 94)개 공간에 특별문자 1621자,  한글음절 2350자와 한자 4888자를 선별 배정한 정보교환용한글부호 KS C 5601(현재 KS X 1001)이다. 그런데 생활용어 중 350음절이 부족하기 때문에 이 코드를 채택한 MS 워드는 완전 기피되고 종전의 조합음절코드를 사용하던 ㅎㆍㄴ글은 시장을 독점하게 된다. 1995년 MS는 국제문자규격을 어기면서 나머지 8822 음절을 지원하는 통합한글코드를 만들어 극복하고 있다. 일본어(JIS X 0208)와 중국어(GB 2312) 등도 다국어환경에서 일관성과 호환성 문제가 존재한다.
바로 이런 문제의 해결책으로 등장한 유니코드(Unicode)는 1988년 조 베커(제록스)에 의해 초안이 발표된다. 이는 아스키와는 다르게 2 바이트 전체 영역을 사용하므로 65536 문자를 수용할 수 있다. 또한 세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 산업 표준으로 1991년에 설립된 유니코드협회가 이를 유지관리하고 있다. 다른 한편 ISO의 국제문자집합(UCS)은 한 문자를 4바이트로 표현하는 ISO/IEC 10646을 발전시켜 오던 중 1991년부터 유니코드협회와 공동 작업을 통하여 분류와 문자명 그리고 유니코드 표준 2.0 버전의 코드와 똑같도록 ISO/IEC 10646BMP(기본 다국어 판)를 통일하여 문자 다루기 알고리즘 등을 포함하는 ISO/IEC 10646-1:1993을 배포한다. 이 때 국내 표준에서 한글코드 문제는 유니코드에서 해결책을 찾는다. 1992년 6월 ISO/IEC SC2 문자코드소위원회 서울회의에 훈민정음 창제원리에 따른 초성, 중성, 종성을 대상으로 한 정음형 코드를 필자가 제안하여 SC2에서 최종 채택되어 U+1100에 배정됨으로써 한글자모란 이름으로 사용되고 있다. 이 때 한글음절 11172 음절도 U+AC00에 반영된다. 필자는 현재 유니코드의 낱자 한글자모로 약 399억 음절을 지원하는 정음 IME를 개발하는 등 30년 연구의 결실로 10월 9일 문화포장을 수훈하였다. 유니코드는 현행 아스키 체제에서 사용하면 충돌이 나므로 아스키는 최상위비트(MSB)가 0인 1 바이트로, 나머지는 MSB가 1인 2 바이트 또는 3 바이트(한글)로 변환되는 UTF-8을 쓰고 있다. 현재 유니코드 11.0은 146개 문자체계에 137,439문자를 포함하고 있다.


변정용 교수 컴퓨터공학과  press@dongguk.ac.kr
<저작권자 © 동대신문 경주캠퍼스, 무단 전재 및 재배포 금지>

인기기사

기사 댓글
첫번째 댓글을 남겨주세요.
0 / 최대 400byte

숫자를 입력해주세요

욕설등 인신공격성 글은 삭제합니다.
신문사소개기사제보광고문의불편신고개인정보취급방침청소년보호정책이메일무단수집거부
38066 경상북도 경주시 동대로 123 (석장동, 동국대학교경주캠퍼스)   |  대표전화 : 054)770-2057~8  |  팩스 : 054)770-2059  |  청소년보호책임자 : 이민영
Copyright © 2018 동대신문 경주캠퍼스. All rights reserved.