快鱼AI深度音频降噪算法

Core Technologies

一、现状与问题

现实生活中,大多数场景拾取的语音信号都带有噪声,在进一步处理信号前,往往要对信号进行降噪,来提升语音的主管听感和可懂度。随着信噪比的减小,降噪方法处理的效果也随之变差,也经常使得语音丢字或者波形失真。如何在低信噪比情况下,达到不错的降噪效果,是一个值得探究的问题。

二、处理方式

现在的语音降噪一般分为两种。

传统信号处理方式:如最小均方算法、谱减法、维纳滤波法;以及基于深度学习的方式,使用深度学习网络直接在时域、时频域处理,使用带噪声语音以及干净语音样本训练降噪模型,使用模型对输入语音进行降噪处理。

基于深度学习(Deep Neural Network)的AI降噪技术:技术优势在于能够快速精确地跟踪环境噪声水平,保持高输出语音质量,将失真度降低到最低。这样可以帮助实现预期目的的抑制稳态和非稳态的噪音,如水声、空调噪声、车辆声、敲击声等。

三、快鱼AI深度降噪

快鱼AI深度降噪,在声音的时频域声谱图上进行,利用精心设计的深度神经网络结构将语音成分从声谱图中提取出来。本方法基于上百小时的清晰语音和几百类日常生活中的常见噪声,采用类U-Net结构的卷积循环网络,经过长时间训练收敛后得到降噪模型。该模型对于常见噪声如风噪敲击流水等等有较好的降噪效果,能大大提高音频信噪比,重点获取到音频中的语音信号。

四、算法演示

公园

公交站

地铁入站口

地铁候车区

©2023 北京快鱼电子股份公司 京ICP备16026144号-2