基于依存图的汉语依存分析技术研究

负责人:陈家骏

依托单位:南京大学

批准年份:2011

前往基金查询
项目简介
项目名称
基于依存图的汉语依存分析技术研究
项目批准号
61170181
学科分类
F020602 信息科学 _计算机科学 _自然语言理解与机器翻译 _语法分析
资助类型
暂无数据
负责人
陈家骏
依托单位
南京大学
批准年份
2011
起止时间
201201-201512
批准金额
55.00万元
摘要
依存文法对于语序灵活的汉语来说具有良好的描写能力,然而"投影性原则"使得依存树基本等价于短语结构树,没有充分体现出表示方法和分析精度的优势。为了摆脱这一限制,满足后续语义分析等应用的需要,本课题提出了基于"依存图"的汉语依存分析方法,重点研究两大问题:一是建立基于依存图的句法标注体系,给出基于原有树库的自动调整和转换方法,并研究与之相应的图搜索算法。另一方面,为了提高长句的分析精度和效率,引入浅层分析技术,使用组块分析捆绑短语使得句子扁平化,使用骨架分析识别长距离搭配以廓清句子结构;尝试用基于图的算法,将浅层分析和依存分析融合起来,最终给出实用的汉语依存图分析算法。
评论区 (0)
#插入话题