基于计算声场景分析的混叠语音分离研究

负责人:赵鹤鸣

依托单位:苏州大学

批准年份:2001

前往基金查询
项目简介
项目名称
基于计算声场景分析的混叠语音分离研究
项目批准号
60172016
学科分类
F010302 信息科学部 _电子学与信息系统 _通信理论与系统 _通信信号处理
资助类型
信息科学
负责人
赵鹤鸣
依托单位
苏州大学
批准年份
2001
起止时间
200201-200412
批准金额
20.00万元
摘要
混叠语音分离研究对于提高实际环境中语音识别系统的性能、移动通信话音质量提高、智能机器人技术中声源数目检测和声源定位等均具有重要意义。本项目研究依据声场景分析的原理分别提出了基于听觉感知、声音空间定位的混叠语音分离和含噪语音增强的方法,并取得了满意的实验结果。通过对混叠语音和含噪语音进行分析建模,对混叠语音分别提取其各自语音流的基音及谐波、双耳时间差ITD和强度差IID等信息,并以此重构目标语音分量,达到分离混叠语音的目的。为此,结合听觉感知特性,提出了基于临界频带(Bark)子波变换等混叠语音基音检测与分离的方法,同时为提高多个基音检测的准确性,提出了用基音概率函数来预测并跟踪各基音的变化。根据声音到达双耳的时间与强度的不同,提出了一种基于声音定位和听觉掩蔽效应的混叠语音分离方法,根据声音到达双耳的时间差和强度差在时频域内确定相应的掩蔽系数,以直接去除干扰信号,保留有用信号以达到分离混叠语音的目的。本项目研究将反映声场景分析思想的听觉模型用于混叠语音分离,并提出了一种可计算实现的听觉模型反演方法。本研究已在《电子学报》等核心刊物发表论文11篇。
评论区 (0)
#插入话题