基于结构化学习的有监督词对齐方法研究

负责人:戴新宇

依托单位:南京大学

批准年份:2010

前往基金查询
项目简介
项目名称
基于结构化学习的有监督词对齐方法研究
项目批准号
61003112
学科分类
F020605 信息科学部 _计算机科学 _自然语言理解与机器翻译 _机器翻译理论方法与技术
资助类型
信息科学
负责人
戴新宇
依托单位
南京大学
批准年份
2010
起止时间
201101-201312
批准金额
20.00万元
摘要
机器翻译是自然语言处理和人工智能领域的重要问题之一,在文本信息处理的各个方面都得到了广泛的应用。词语对齐是统计机器翻译的必需步骤,对机器翻译的结果有决定性的影响。传统的词对齐采用无监督的方法,近年来,人们开始利用有标记的信息进行有监督的基于结构化预测的方法来提高词对齐的效果。 针对现有的基于结构化预测的词对齐研究中存在的难以融入全局特征、数据稀疏、领域不一致等问题,本项目拟结合国内外现有的研究成果,在结构化预测的框架下,采用基于压缩森林的重排序方法、协同训练、子样本加权等策略,探索更为有效的利用标记数据的词对齐学习方法,从而提高机器翻译系统的效果。
评论区 (0)
#插入话题