基于DBN协同建模的中文及跨语种语音结构事件检测研究

负责人:谢磊

依托单位:西北工业大学

批准年份:2011

前往基金查询
项目简介
项目名称
基于DBN协同建模的中文及跨语种语音结构事件检测研究
项目批准号
61175018
学科分类
F030404 信息科学部 _自动化 _模式识别 _语音识别、合成与理解
资助类型
信息科学
负责人
谢磊
依托单位
西北工业大学
批准年份
2011
起止时间
201201-201512
批准金额
59.00万元
摘要
语音结构事件检测是从语流中自动检测出诸如非流利区域、句边界、话题边界等语音结构线索的任务,是确保口语翻译、人机对话、语音检索等后续任务性能的重要前提。本项目突破现有方法局限,探索适合中文及跨语种(Multilingual)语音结构事件检测的新方法和新途径。首先,放弃现有各种语音结构事件单独建模的框架,利用动态贝叶斯网络模型(DBN)强大的建模能力,为多种相关的语音结构事件进行统一协同建模,更为真实、准确的反映不同事件之间的关系,进而大幅提高语音结构事件的检测效果。其次,充分利用中文语言的特点,提出更为适合中文语音结构事件检测的韵律特征和词汇特征。在跨语种语音结构事件检测工作上,放弃传统方法中需要大量语料资源与工具的做法,从提取跨语种通用韵律特征、直接在语音信号上挖掘结构事件线索等方面,研究高效、只需少量资源的新方法。通过本项目研究,大大提高语音结构事件检测效果。
评论区 (0)
#插入话题