基于分段条件随机场的连续语音识别技术-国家自然科学基金摘要查询-MedSci.cn

项目简介

项目名称

基于分段条件随机场的连续语音识别技术

项目批准号

61175017

学科分类

F030404 信息科学部 _自动化 _模式识别 _语音识别、合成与理解

资助类型

信息科学

负责人

屈丹

依托单位

中国人民解放军信息工程大学

批准年份

2011

起止时间

201201-201512

批准金额

58.00万元

摘要

连续语音识别技术对国家信息安全有重要的意义。当前主流的基于连续密度隐马尔可夫模型（CDHMM）的大词汇量连续语音识别方法没有考虑人的思维认知过程，忽略了很多高层知识，因此可以提高的性能有限。因此，需要研究多元、多颗粒度信息整合的连续语音识别框架、模型和技术。分段条件随机场（SCRF）在多层次信息有效整合方面具有独特优势，因此，本项目主要研究基于分段条件随机场的连续语音识别模型及关键技术。首先在语音信息表示机理方面，研究多元、多颗粒度信息特征表示方法，包括新型模板匹配识别、点过程模型、说话人自适应等信息的表示；其次研究分段条件随机场的信息整合机制，减少对整合信息的条件限制；最后将多种信息最大限度地整合到分段条件随机场，实现更符合人类思维认知的连续语音识别。本项目研究将有望解决HMM模型连续语音识别面临的瓶颈问题，丰富语音识别的理论算法，为从深层次、多角度认知与语音提供有效手段。

相关基金

成年聋人发音错误检测中的语音学特征方法研究
基于电话语音的维吾尔语说话人识别研究
结合成像特性和三维深度时空神经网络的VideoSAR动目标检测与语义分割
基于模型自适应修正和协同决策的说话人鲁棒语音情感识别方法研究
基于分布式声传感器网络和量子优化学习的说话人分类标记研究

评论区 (0)

#插入话题

插入图片

下载梅斯医学APP，方便讨论，随时阅读！立即前往下载 >>

内科

外科

专科科室

热点

按科室浏览

临床工具

科研工具

其他工具

科研数智化

真实世界研究解决方案

数字化学术传播解决方案

其它

科室

工具

服务