互译语言形态非对称的统计机器翻译模型构造方法研究

负责人:李淼

依托单位:中国科学院合肥物质科学研究院

批准年份:2010

前往基金查询
项目简介
项目名称
互译语言形态非对称的统计机器翻译模型构造方法研究
项目批准号
61070099
学科分类
F020604 信息科学部 _计算机科学 _自然语言理解与机器翻译 _少数民族语言文字信息处理
资助类型
信息科学
负责人
李淼
依托单位
中国科学院合肥物质科学研究院
批准年份
2010
起止时间
201101-201312
批准金额
32.00万元
摘要
在统计机器翻译过程中,由于互译语言(源语言与目标语言)形态结构不对称,极易造成译文错误。2005年以来,将语言学形态知识应用于统计机器翻译的方法引起了国内外学者的广泛关注,并围绕英语/捷克语、英语/土耳其语等形态非对称语言的机器翻译开展了研究。我国少数民族语言大多属于形态丰富语言(屈折语、黏着语),而汉语属非形态语言(孤立语)。在汉/民机器翻译中,由于语言形态结构不对称,经常导致译文在语法、语义、语用等层面出现错误。本项目针对上述问题,拟开展以下研究:1、多层级的形态分析方法;2、形态信息与统计模型融合策略;3、融合形态信息机器翻译解码算法;并以语言形态差异较大的汉/蒙统计机器翻译为例,开展相关实验。 通过上述研究,探索应用形态学知识构建统计模型的机制;为形态丰富的屈折语和黏着语的形态处理提出有效的解决方案;为互译语言形态非对称的统计机器翻译模型构造理论方法提供新思路和依据。
评论区 (0)
#插入话题