基于分段条件随机场的连续语音识别技术

负责人:屈丹

依托单位:中国人民解放军信息工程大学

批准年份:2011

前往基金查询
项目简介
项目名称
基于分段条件随机场的连续语音识别技术
项目批准号
61175017
学科分类
F030404 信息科学部 _自动化 _模式识别 _语音识别、合成与理解
资助类型
信息科学
负责人
屈丹
依托单位
中国人民解放军信息工程大学
批准年份
2011
起止时间
201201-201512
批准金额
58.00万元
摘要
连续语音识别技术对国家信息安全有重要的意义。当前主流的基于连续密度隐马尔可夫模型(CDHMM)的大词汇量连续语音识别方法没有考虑人的思维认知过程,忽略了很多高层知识,因此可以提高的性能有限。因此,需要研究多元、多颗粒度信息整合的连续语音识别框架、模型和技术。分段条件随机场(SCRF)在多层次信息有效整合方面具有独特优势,因此,本项目主要研究基于分段条件随机场的连续语音识别模型及关键技术。首先在语音信息表示机理方面,研究多元、多颗粒度信息特征表示方法,包括新型模板匹配识别、点过程模型、说话人自适应等信息的表示;其次研究分段条件随机场的信息整合机制,减少对整合信息的条件限制;最后将多种信息最大限度地整合到分段条件随机场,实现更符合人类思维认知的连续语音识别。本项目研究将有望解决HMM模型连续语音识别面临的瓶颈问题,丰富语音识别的理论算法,为从深层次、多角度认知与语音提供有效手段。
评论区 (0)
#插入话题