央广网

“汉字全息资源应用系统”在京上线 解决不同发展阶段汉字对接问题

2019-01-11 15:59:00来源:央广网

  央广网北京1月11日消息(记者车丽 实习记者张亚莉)据中国之声《央广新闻》报道,教育部“奋进之笔”行动、国家语委重大基础资源建设项目“通用汉字全息数据库建设”的标志性成果“汉字全息资源应用系统”今天(11日)在北京上线,解决不同发展阶段汉字之间的对接问题。

  打开“汉字全息资源应用系统”,记者看到有四大模块,包括单字检索、综合检索、专书检索和历代字形检索。例如,单字检索是通过不同的方式输入字形来达到检索目的,检索结果展示这个字形的全部形、音、义、用、码的所有属性及历代原形字形,即“以字查息”;而综合检索、历代字形检索的理念正好相反,是通过设置、输入不同的检索条件,找到自己想要的那部分符合条件的字形,如果想要关注字形的详情,也可以回到单字检索的页面,这种检索方式即“以息查字”。前者满足一般使用者的需要,可以通过字形检索,了解该字形的未知信息;后者满足专业人士的需要,为科研提供证据和数据上的支撑。

  该系统在功能开发方面集成了模块化检索、复合属性类聚、属性深度系联、字形动态演化等新型的汉字资源应用功能,体现出较高的学术水平和技术创新。系统中对汉字属性信息进行深度系联的工具,不仅可以弥补传统手工获取资源、系联资源的局限,还可为用户提供更大范围的线索,从而深化对汉字之间深层关系的认识。

  项目主持人、北京师范大学教授王立军表示,应用系统解决了不同发展阶段汉字之间的对接问题,全面呈现现代通用汉字和古今印刷通用汉字有关形、音、义、码、用等多维属性体系。“所谓全息,体现在关于汉字的多方面有关属性信息的呈现。我们力图从现代应用的角度,建构一个科学、系统、高效、实用的汉字全息资源应用平台,从而有效满足不同领域汉字应用的多元化需求。”王立军说。

  需要指出的是,这里的“全息资源”不是收集全部汉字,也不是构建大而无当的参数结构,而是严格根据现实应用的实际需求,尽可能全面收集现代语文生活中真正有用的汉字属性信息。同时系统还采取多层级的字集设计模式,包括常用字集、现代通用字集、古籍印刷通用字集、全字符集等。以这种不同字符集细分用户,来满足不同用户需求。

  系统建设采用了先进的数据库技术、信息挖掘技术、图形处理技术、可视化技术等手段,使语言文字发展的最新成果惠及更多领域和更广大的人民群众。既可作为基础教育及汉语国际教育领域的教学平台,也可作为文字学及相关专业领域专家学者的科研平台,还可作为国内外文化爱好者的学习平台。

  教育部语言文字信息管理司副司长刘宏表示:“汉字具有独特的结构,形、音、意之间又具有特定的关系,这在全息库的各种属性信息中都有充分的体现。汉字是中华文化的基因,使中华民族拥有共同的文化基础。全息库的上线,会让全国和世界更好地了解汉字的发展及其文化内涵,促进汉字文化发扬光大。”

编辑: 张潇祎