2011년 9월 10일 토요일

만주문자 식자

신문에서 재미있는 기획연재물을 보면, 스크랩해 놓기도 한다. 그러다가 TeX을 알게 되고 난 다음에는, 브라우저에서 기사를 긁어서 TeX 형식으로 간단한 편집을 해서 저장을 해 놓게 되었다.

이 주 쯤 전에 지인을 만나, 요즘 모으고 있는 그 연재물에서 읽었던 내용을 이야기한 적이 있다. 집에 돌아와서 스크랩 한 것을 보내주면 어떨까 생각했었는데, 아무래도 신문기사에 난 것이다 보니, 이것 저것 정보를 더 보태고 싶어졌다. 등장하는 역사 인물의 한자 이름과 생몰년도 따위를 추가하고, 간단히 언급된 사실에 대하여 내가 아는 대로 좀 더 보충하고, 뭐 그런 짓을 하고 싶어졌던 것이다.

요즘은 인터넷이 하도 좋아져서 어지간한 자료는 인터넷에서 다 찿아졌다. 생몰년을 찾으려고 사람 이름으로 검색하면, 위키로 들어가서 항목을 읽게 되는데, 유명한 인물을 찿을 때 조차도 완전히 처음 알게되는 그런 일화들에 빠져들게 되면서, 작업이 상당히 지체되었다. 또한 그러면서 또 배움이 있어 한편으로는 즐거웠다.

나는 아는 바가 일천하게 그지 없지만, 원전에 대한 욕구는 강한 편이다. 일종의 속물근성이기도 하다. 그런데, 인물의 생몰년을 찾는 과정과 요 몹쓸 속물근성이 합쳐지면서 상당히 곤란한 지경에 빠져들게 되었다. 찾는 인물중에 누르하치와 홍타이지가 나왔던 것이다. 생몰년은 크게 상관이 없다. 문제는 이름이다. 이 사람들은 중국사람이 아니니까 오른쪽에 붙은 괄호 안에 음차된 한자를 적어 넣는 것은 예의가 아니다. 따라서 만주문자를 붙여 넣어야 되는데, 이것이 쉽지 않다는 것이다.

일단 다언어 식자를 훨씬 수월하게 할 수 있는 XeTeX로 컴파일 할 수 있게 약간의 수정을 했다. 그리고 fontspec 팩키지를 어떻게 사용하는지 KTUG에서 배웠다. 그런데 문제는 만주문자 폰트였다. 처음에 찾은 것은 만주문자를 키보를 통해 입력할 수 있게 하는 프로그램이었다. 말하자면 날개셋 같은 프로그램이었다. 그리고 그 프로그램에 딸려 나오게 되어 있는 만주어 폰트를 찾아서 깔고, 테스트를 해 보았는데, 결과가 마음에 들지 않았다.

만주문자는 아랍어와 마찬가지로 단독·어두·어중·어미에서 쓰일 때 그 모습이 변화하는데, 방금 깔았던 그 만주어 폰트는 그 과정을 완전히 처리하지 못했다. 어두형이 중간에 박히거나 하는 식이었다. 깨끗하게 포기하고, 프로그램과 폰트를 지웠다.

다음에 찾아 낸 프로그램은 중국인이 개발한 프로그램이다. 이 프로그램은 입력창에 로마자로음차된 만주문자를 쳐 넣으면, 그것을 기초로 하여 만주문자를 짜 내 비트맵 형식으로 오른쪽에 출력하였다. 즉 범용으로 만주문자를 입력할 수 있는 시스템도 아니고, 따라서 IME 설정을 건드릴 필요도 없다. 그런데 친절하게도 그 중간단계를 보여주고 있다. 그 중간단계라는 것은 어두·어미·어말형이 각각 어떤 로마자에 할당되었는지 보여주는 것이다. 간단하게 말하면, 어두형은 로마자 I에, 어중형은 i에 각각 대응하도록 만든 것이다. 음차된 만주어를 어두·어중·어말형이 구분된 스크립트로 부호화 하고, 마지막으로 그 부호에 따라 이미 정해져 있는 만주문자를 출력하는 시스템이었던 것이다. 좀 엉성해 보이기는 하지만, 이런 방식으로 얻은 출력물이 훨씬 퀄리티가 좋았다. 이 프로그램이 사용하는 만주어 폰트는 유니코드의 만주·몽골 문자 영역에 할당되어 있는 것이 아니라, 로마자 영역에 할당되어 있는 것이다. 그래서인가, 그 프로그램의 만주어 폰트 이름은 Times New Manchu였다.

아, 나는 당연히 만주어 배운 적도, 할 줄도 모르나, 그 테스트라는 것은 간단히 그 만주어 모양을 (위키를 통해서) 알고 있는 누르하치나, 홍타이지 같은 만주 단어를 표시했을 때 얼마나 비슷하게 나오는가를 비교하는 것으로, 눈만 달려있으면 누구나 할 수 있는 것이다.

마지막 단계는 이 폰트를 TeX에서 사용하는 것인데, 그 결과가 역시 예상했던 대로였다. 기뻤다.

댓글 없음:

댓글 쓰기