快鱼电子声源定位系统

Core Technologies

一、系统简介

主要通过三维立体声源定位算法,对于音强超过一定阈值的声源方向进行定位,通过控制摄像头转动转向音源方向。

基于音频信号融合感知阵列的的声源定位技术是声音信号处理技术是本项目的重点研发方向之一,具有广泛的应用前景和实际意义。

通过对三种经典的定位方法比较分析,根据该系统实现的实时性和稳定性要求,采用了是基于时延估计的和相位分析相结合的定位方法。分别对任意三元阵、四元方阵和五元十字阵的被动声音定位的算法原理和误差进行理论研究,确定自己的声源定位机制。同时采用基于最小均方(LMS)的自适应时延估计算法原理在频域的实现和改进形式,提高时延估计的精度。

连接方式

可以和后台主机直接通过网口连接,也可以和摄像头通过485总线或者其他总线进行连接。

摄像头理论上支持任意一款可以二轴转动的摄像头(球机),水平方向能转动0-360,垂直方向能转动0-90度,此Demo现在是和大华的一款摄像头通过网络连接方式集成。其他摄像头通过提供调用SDK即可集成。

特点

  • 通过优化算法,仅五颗麦克风即可实现空间定向,其中四颗在水平面,有一颗在垂直方向。

  • 保证水平方向收音的均匀性,同时又能进行3D定向

  • 指向精度高,经过专业的消音室测试,抛开声源的抖动性,定向分辨率在5°左右。

  • 算法实时作用帮助实现预期目的的,驱动音频发声到高速球机反应动作,不超过1秒钟

  • 具有较强的抗混响的效果,即使在空旷、混响声很严重的室内环境,也能保证较高的指向准确度,不受混响的干扰。

  • 如果有不同的音源同时发声,当前算法设定只选择音强最高的方向输出给摄像头。

  • 拾音范围,若用人声的呼喊声做示例,使用环境在5米。

  • 留有充裕的用户可调节接口,比如驱动摄像头转动的音强阈值,摄像头反应时间等,可以根据用户的需求设定不同的值。

视频演示

设备参数

专业消音室测试,定向分辨率在5°左右;
室外5米距离,10°左右;
实时作用帮助实现预期目的的,声源发声到高速球机反应动作,不超过1秒钟;
拾音范围,若用人声的呼喊声做示例,使用环境在5米;
组成:4+1 立体式麦克风阵列
定位范围:水平方向0-360,垂直方向0-90度。有不同的声源同时发声,算法设定选择声强最高方向
适用设备:直接与球机实现联动,摄像头理论上支持任意一款可以二轴转动的球机。

©2023 北京快鱼电子股份公司 京ICP备16026144号-2