基于计算声场景分析的混叠语音分离研究-国家自然科学基金摘要查询-MedSci.cn

项目简介

项目名称

基于计算声场景分析的混叠语音分离研究

项目批准号

60172016

学科分类

F010302 信息科学部 _电子学与信息系统 _通信理论与系统 _通信信号处理

资助类型

信息科学

负责人

赵鹤鸣

依托单位

苏州大学

批准年份

2001

起止时间

200201-200412

批准金额

20.00万元

摘要

混叠语音分离研究对于提高实际环境中语音识别系统的性能、移动通信话音质量提高、智能机器人技术中声源数目检测和声源定位等均具有重要意义。本项目研究依据声场景分析的原理分别提出了基于听觉感知、声音空间定位的混叠语音分离和含噪语音增强的方法，并取得了满意的实验结果。通过对混叠语音和含噪语音进行分析建模，对混叠语音分别提取其各自语音流的基音及谐波、双耳时间差ITD和强度差IID等信息，并以此重构目标语音分量，达到分离混叠语音的目的。为此，结合听觉感知特性，提出了基于临界频带(Bark)子波变换等混叠语音基音检测与分离的方法，同时为提高多个基音检测的准确性，提出了用基音概率函数来预测并跟踪各基音的变化。根据声音到达双耳的时间与强度的不同，提出了一种基于声音定位和听觉掩蔽效应的混叠语音分离方法，根据声音到达双耳的时间差和强度差在时频域内确定相应的掩蔽系数，以直接去除干扰信号，保留有用信号以达到分离混叠语音的目的。本项目研究将反映声场景分析思想的听觉模型用于混叠语音分离，并提出了一种可计算实现的听觉模型反演方法。本研究已在《电子学报》等核心刊物发表论文11篇。

内科

外科

专科科室

热点

按科室浏览

临床工具

科研工具

其他工具

科研数智化

真实世界研究解决方案

数字化学术传播解决方案

其它

科室

工具

服务