논문 상세보기

汉字编码与字书整理

  • 언어CHI
  • URLhttps://db.koreascholar.com/Article/Detail/279380
모든 회원에게 무료로 제공됩니다.
한국한자한문교육학회 (The Korea Association For Education Of Chinese Characters)
초록

汉字历史积淀深厚,数量庞大,使用汉字的国家、地区多,且所用字形各有不同。中国大陆除简化字外,还有传世古籍所用繁体字等;现时港澳台地区所用繁体字与中国大陆历史上所出现的繁体字在字形上也略有不同;还有日本、韩国、越南等汉字文化圈各国,除自身所造新字之外,所用字形也不同于中国。如此诸多因素,给汉字统一编码带来困难。历代字书是最集中存储汉字形体及汉字属性的载体,对字书进行整理,从中提取汉字字形进行编码,是进行汉字编码的最佳捷径。自二十世纪七十年代起,汉字计算机编码走过了一条艰辛的道路,经历了三个发展阶段,虽然截止目前已经对9万多个汉字编了码(可以方便使用的有6.5万),经过我们对《类篇》字形的整理,发现仍然有大量字形没有编码。对历代字书字形进行全面整理,补充编码字符集,是非常必要的,对更好的进行古籍整理及古籍再版都是有意义的。在现有技术条件下,对字书进行全面整理,提取未编码字形,需要经过如下几个步骤:(1)资源调查搜集书目;(2)选择、获取版本;(3)扫描原始图档;(4)录入电子文本;(5)制作属性数据库;(6)梳理字际关系;(7)切割字头单字图像;(8)提取未编码字单字图像;(9)编制专书未编码字表及属性表。

저자
  • 周晓文(北京师范大学民俗典籍文字研究中心 中国文字整理与规范研究中心)