中国内地首个字书汉字字料系统由渤海大学柳建钰博士等研发成功

中国国内首个字书汉字字料库系统(CCFD)由渤海大学(位于辽宁省锦州市)文学院柳建钰博士和锦州国信科技有限公司联合研发成功。

字料库是由语料库类推出来的一个概念。汉字字料库是汉字学与计算机信息科学交叉融合后形成的一个崭新事物,能够为我国当前的汉字整理研究提供大量真实可靠的资料,是学者从事汉字学研究工作的一种全新工具。

通过将字典辞书彻底信息化,字书字料库能够为汉字学研究提供具有客观性、真实性、规模化、多功能、高度结构化的字书汉字数据信息,将极大推动全汉字整理研究工作的信息化之路。

该系统基于sql数据库设计,通过直观友好的操作界面,用户可以对字书字料进行方便高效的录入、标注、系联、查找、对比、导出、备份、恢复、打印等工作。

该系统主要有三个特点

操作界面简单直观:

该系统由柳建钰博士精心设计,用户不用懂sql数据库知识就可以对字料库进行各项操作。

学术性强:

整个字书字料库是在科学汉字构形学理论指导下研制开发的,包括属性字段的设立、具体功能的配置,都体现出了研发者对学术的不懈追求,有效避免了字料库低水平建设的弊端。

系统功能高度集成:

字书字料库各种重要功能以模块化的方式进行开发,采用高速检索技术整合各个模块,提供方便快捷的字书汉字加工、查询、对比服务,能够极大地提高汉字整理研究的效率。

已有30多位汉字学学者试用该系统,反馈良好。柳建钰博士研发的字书字料库包含了UNICODE最新版本收录的8万多汉字的详细信息,来源上包括中国、日本、韩国、越南等国家以及中国台湾、中国香港等地区,另有古文、小篆、隶书、楷书等大量的字书文字资料,犹如一座“汉字博物馆”。

用户可以通过计算机对汉字信息进行各种分类、统计、检索、综合、比较等研究工作。

目前,该库已收录并标注的数据达40余万条,而且仍以每季度一本字书的速度进行扩充。

柳建钰博士的大学及研究生生活是在宁夏大学度过的,后在北京师范大学文学院攻读博士学位,师从著名语言文字学者李国英教授,现为渤海大学内聘教授、文学院语言学教研室主任、汉语言文字学专业硕士点负责人,主要从事字书汉字整理研究、中文信息处理(汉字字料库)研究、古典文献学研究。

柳建钰博士一直从事汉字整理研究工作,先后主持国家社科基金项目、教育部人文社科基金项目、辽宁省社科基金项目等,目前正致力于字书汉字字料库系统这一巨型平台的建构和研究工作。

“字料库”是由著名语言文字学者李国英教授与周晓文教授在2009年首次提出的一个语言文字学概念。

语料库是当代语言学研究的重要方法,但由于缺乏满足文字学研究需要的字料库,字料库的文字学研究还是一片空白。字料库是在大规模真实文本的基础上生成的真实的文字书写形态的有序集合,是利用计算机对文字形体进行各种分类、统计、检索、综合、比较等研究的基础。

自从“字料库”概念提出后,柳建钰博士在李国英教授的鼓励、指导下,一直潜心研究字书字料库系统这一课题,与锦州国信科技有限公司通力合作,于2015年10月成功研发出国内首个字书字料库系统,并取得软件著作权证书。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注