基于语义分析的汉语文本错误自动侦测与纠错方法

负责人:张仰森

依托单位:北京信息科技大学

批准年份:2010

前往基金查询
项目简介
项目名称
基于语义分析的汉语文本错误自动侦测与纠错方法
项目批准号
61070119
学科分类
F020601 信息科学部 _计算机科学 _自然语言理解与机器翻译 _计算语言学
资助类型
信息科学
负责人
张仰森
依托单位
北京信息科技大学
批准年份
2010
起止时间
201101-201312
批准金额
33.00万元
摘要
电子文本已成为当今主要的信息资源和交流媒介,汉语文本的错误侦测与纠错研究是电子出版、数字图书馆建设、网络媒体及办公软件开发等领域亟待解决的问题。如何发现数字文本中的各种错误并实现自动纠错是自然语言处理领域的挑战性课题,尤其是语义搭配上的错误。本项目的内容是在句法和语义学理论指导下,研究从大规模语料和其它语言知识资源中获取句法语义搭配知识的方法和途径,研究语义搭配关系的表示方法与存储组织技术,构建语义知识库;然后基于语义知识库构建语义级文本错误的自动侦测模型;再针对侦测出的各种错误,构建纠错知识库,并依据它研究候选纠错建议的产生和排序方法,提高纠错建议的有效性。本项目的目的是将字词级的文本错误侦测扩展到句法语义级,通过句法语义分析建立汉语文本字词级和语义级文本侦错与纠错的一体化模型,提高文本校对系统的召回率和精确率。本项目对电子出版、数字图书馆建设、编辑排版软件开发等具有重要的意义。
评论区 (0)
#插入话题