中国第一个计算机中文信息库建在北京师范大学
中国第一个以处理中文语词为对象的“计算机中文信息库”1985年在北京师范大学建成。
在1985年7月10日召开的鉴定会上,专家们一致认为,此项成果具有重要的科研与应用价值,是中文语词处理研究领域的重大突破。
此前的中文信息研究只限于处理汉字,尚没有处理语词的手段与技术。
北京师范大学现代教育技术研究所开发的“计算机中文信息库”是一种新型的、功能强大的软件系统,它由“汉字信息库”、“词汇信息库”和“语言资料库”组成,可对任意专业的语言资料自动生成相应专业的词库,能自动进行总词频统计和多种分布频率统计,并可根据现在词库快速生成“构词字典”。
该系统对当时现行的中小学语文教材全24册共106.8万字实现了国内第一次完全计算机化的词频统计,统计数字全面准确。这些数据不但为中小学语文教材的编制、修改提供了可靠根据,对于科学测试语文水平、制定扫盲标准以及教育政策都有重要的参考价值。
计算机中文语言信息库软件系统的研究成功为中文信息处理和语言工程开发提供了先进的技术手段,是一项对中国教育事业具有深远意义的成果。
这项成果还仅在国内是首创,目前在国外也未见类似功能的软件系统公布和发表。