双耳语音可懂度增强技术的研究

负责人:李军锋

依托单位:中国科学院声学研究所

批准年份:2010

前往基金查询
项目简介
项目名称
双耳语音可懂度增强技术的研究
项目批准号
11074275
学科分类
A040506 数理科学部 _物理学Ⅰ _声学 _语言声学、乐声及声学信号处理
资助类型
数理科学
负责人
李军锋
依托单位
中国科学院声学研究所
批准年份
2010
起止时间
201101-201312
批准金额
46.00万元
摘要
语音增强是语音信号处理的一个重要研究课题,具有极其广泛的应用前景。根据处理目标的不同,语音增强技术可以分为:以提高语音质量为目标的增强算法和以提高语音可懂度为目标的增强算法。当前的语音增强技术对噪声抑制、提高语音质量有显著效果,但对语音可懂度的提高没有效果,甚至往往降低了语音可懂度。本项目拟提出一个基于双耳听感知机制的语音可懂度增强算法,其利用双耳信息构造空、时、频二元掩模,从而提高语音可懂度和保持双耳信息(听觉场景)。在对双耳听感知机制进行研究的基础上,我们提出基于互相关模型的空间二元掩模构建方法和基于等化-消除模型的时频二元掩模构建方法。在此基础上,构建空时频二元掩模,并应用于双耳带噪信号实现语音可懂度的增强,同时保留原有的听觉场景信息。本项目的特色和创新在于:提高了语音可懂度和保留了双耳信息。研究成果可以进一步应用于先进语音通信系统、远程会议系统、双耳助听器等。
评论区 (0)
#插入话题