历时8年研制的《通用规范汉字表》12日起面向社会公开征求意见。字表发布后,社会各领域的现代通用汉字,原则上应使用表内字。
对于每天都要说话、写字的现代人来说,这套规范解决了哪些问题?对日常生活和学习有何意义?教育部有关负责人和专家对此进行了解读。
字表分三级 收字8300
国家语委副主任、教育部语言文字信息管理司司长李宇明说,《通用规范汉字表》是《中华人民共和国国家通用语言文字法》的配套规范,是现代记录汉语的通用规范字集。
据介绍,《通用规范汉字表》收字8300个。根据字的通用程度,字表划分为三级:一级字表收字3500个,是使用频度最高的常用字,主要满足基础教育和文化普及层面的用字需要。二级字表收字3000个,使用频度低于一级字。一级、二级字合起来共6500字,主要满足现代汉语文本印刷出版用字需要。三级字表则是一些专门领域,包括姓氏人名、地名、科学技术术语、中小学语文教材文言文使用的未进入一、二级字表的较通用的字,共收字1800个,主要满足与大众生活和文化普及密切相关的专门领域的用字需要。
每个规范字都有来历
能够入选一、二级字表的汉字,是根据其使用频率来确定的。专家们采用了9个信息庞大的“语料库”的数据进行了统计。据北师大文学院讲师卜师霞介绍,最为主要的两个语料库是“国家语委现代汉语平衡语料库”和“北京语言大学现代新闻媒体动态流通语料库”,收录的汉字量分别为9100万和3.5亿。
“《通用规范汉字表》中收录的每个字,都有明确的来历。”北师大文学院讲师凌丽君说,汉字中有大量的异体字存在,为了确保字表中收录汉字的规范性,研制工作组的专家学者们对每个汉字的出处、正异对应关系都进行了检索和考证,为此甚至查遍了包括《四库全书》在内的典籍文献。
罕见姓氏得以被正名
“氾”、“仝”、“谿”、“缐”、“甯”,这些字曾被视为“泛”、“同”、“溪”、“线”、“宁”的异体字或繁体字;但是很少有人知道,它们其实原本也是姓氏。出于对家族传统的尊重,在此次制定的《通用规范汉字表》中,这些汉字首次以姓氏用字的身份,被保留在三级字表中。
字表研制专家工作组组长、北师大文学院教授王宁以“缐”字举例说,一些“缐”姓人士曾向专家们反映:“这个字中的部件‘泉’,给人流动的感觉,换作‘线’中的两个‘戈’,这层美好的意义就被破坏了。”而恢复这些罕见姓氏的本来面貌,将使得标志血脉传承的功能和文化内涵的姓氏用字得以保存。
一些汉字能够收入字表,是基于人性化的考虑。比如“喆”原本被视为“哲”的异体字,但是研制工作组的专家学者们经过调查发现,全国有两万多人的名字中选用了这个字。专家们接受了民众的意见,认为,“喆”字中两个“吉”并排看起来很祥和,比“哲”字更适合取名,因而把它收入了三级字表,专门作姓名用字使用。
据了解,此次公示的字表中共恢复了51个异体字,调整了6个繁体字。不过这些异体字和繁体字并不能任意使用。王宁教授解释说,字表做了明确的规定,这些字只能限用于特定的地名或姓氏、人名用字;在一般意义上使用文字时,还不能随便写异体字和繁体字。
8300个规范字够用吗
曾有一些消息灵通人士提出:现在进入国际编码的汉字已有近8万个;此次字表中的规范汉字却只有8300个,仅凭这些字真的够用吗?对此王宁教授回应说:“汉字不是越多越好,而是适用为好。比如全套的《十三经》,是公认的文化经典,词汇非常丰富,不过才使用了6000左右不重复的字。”
从文字使用频率的统计来看,真正的通用汉字其实也不多。王立军教授介绍说:“字频排列在3000以后的汉字,已经很少使用了;统计表明,仅仅书写现代汉语文本的用字,一、二级字表的6500字就覆盖全部语料的99.8%,加上三级字表的1800字,余下的字用处实际很少了。”
原则上不恢复繁体字
李宇明介绍,对繁体字恢复和类推简化问题,曾进行过反复的研讨。研制组最终得出的结论是:为了维护社会用字的稳定,字表原则上不恢复繁体字;将类推简化的范围严格限定在字表以内,以保持通用层面用字的系统性和稳定性;允许字表以外的字有条件使用,但不类推简化。
本报综合新华社、北京晚报等报道