您当前的位置:首页 > 生活资讯 > 科技|生活

科学家提出一种新的语谱引导滤波语音去混响方法

时间:2018-05-02  来源:本站  作者:

  中国科学院声学研究所噪声与振动重点实验室副研究员郑成诗及其同事提出一种语谱引导滤波语音去混响方法,无需估计晚期混响功率谱和房间声学参数,运算量明显低于传统语音去混响方法,同时能显著提高语音质量。相关研究成果已在线发表于国际学术期刊Applied Acoustics。 已有研究表明,晚期混响声会不同程度地降低语音可懂度及其人机交互语音识别性能,如何有效抑制晚期混响声是近年的研究难点和热点。

  单通道晚期混响抑制方法包括谱减法和基于高阶累量的方法等。基于高阶累量的方法,包括Kurtosis最大化和Skewness最大化这两种方法,运算量较大;基于谱减的方法,尽管运算量小、性能稳定,但是需要估计晚期混响功率谱或者房间声学参数。 双边滤波(Bilateral Filtering)和引导滤波(Guided Filtering)是两种比较经典的图像处理方法,都可以用于保持图像边缘,实现图像增强。相比较而言,引导滤波运算量更低、处理结果更为稳定。因此,引导滤波在图像去雾、边缘提取以及细节平滑等方面得到了广泛的应用。

  相比于纯净语音语谱图,混响语音语谱图就像是给纯净语音语谱图蒙上了一层雾。郑成诗在丹麦奥尔堡大学访问期间,曾与奥尔堡大学的教授一起尝试研究图像去雾算法应用于语音去混响,通过分析和实验证明了语谱引导滤波在去混响方面的性能。 语音语谱图有其自身特点,例如语谱在频率轴上的相关性一般要远小于语音在时间轴的相关性。

  在此基础上,郑成诗及其团队对应用于图像的引导滤波进行了拓展,使其更适用于语谱图增强。 相比传统的方法,该研究提出的语谱引导滤波语音去混响方法在主观语音质量评估(Perceptual Evaluation of Speech Quality,简称PESQ)得分和短时客观可懂度( Short-Time Objective Intelligibility,简称STOI)得分等方面优势显著,而且算法时间复杂度为O(1)。从语谱图看,晚期混响造成的拖尾效应也已得到有效抑制。 该研究得到了国家自然科学基金委的项目支持。(来源:中科院声学研究所) 论文链接

来顶一下
近回首页
返回首页
推荐内容
推荐文章
如何用 EndNote 编辑适合投稿杂志的参考文献格式
如何用 EndNote 编
如何进行医学论文发表与写作
如何进行医学论文
如何获取制作高质量SCI论文图片?
如何获取制作高质
虚拟现实、云技术、人工智能,未来教育有啥不一样?
虚拟现实、云技术
代写论文被发现 竟因毕业论文“高大上”
代写论文被发现 竟
如何使用Endnote X7进行文献管理?
如何使用Endnote
SCI医学论文写作及投稿技巧汇总
SCI医学论文写作及
“你的论文充斥着垃圾”:英文科研论文写作逆袭之路
“你的论文充斥着
赞助商链接
热门文章
  • 人体自救九大奇招:时刻检查心脏健康的
  • 从书写字迹看性格的不同
  • 吃鸡蛋5大误区
  • 专家建议七种食物必须吃
  • 美报:年轻科学家,去中国吧!
  • 最实用的5个刷牙诀窍
  • 夏日午休4个误区:午饭后不要立刻睡
  • 英国媒体评出全球29项最新环保科学技术
  • 揭密5种睡姿与疾病的神秘关系
  • 专家称女性用电脑过度易致电脑脸
  • 研究表明在幼儿园学到更多知识孩子长大
  • 两眼间距决定是否漂亮 女性最完美面孔
  • 最新文章
  • 人工智能识别健康和发病土壤
  • 科学家找到消除成瘾记忆的“橡皮擦”
  • 模型预测哪些儿童有肥胖风险
  • 青蛙是怎么变绿的
  • 科学家揭示随机光场中涡旋导致相干性退
  • 研究揭示造山型金矿流体来源和演化
  • 伊辛模型研究自旋玻璃获进展
  • 首例新冠母婴传播被证实
  • 压力升高促使二维钙钛矿发光性能提升
  • 海龟惊世航海壮举依赖粗糙的天然“地图
  • 木质文物保存状态可实现无损评估
  • 科学家研究证实每晚睡6-7小时可预防痴
  • Copyright © 2007-至今 yijy.com,All Rights Reserved 医家园