“远场识别”是什么?神奇的“麦克风阵列”又是什么?本文来自微信公众号:KnowingAI知智(ID:Knowing_AI),作者:虞喵喵。
对着手机讲话识别效果很好,可是距离远一点,再离远一点呢?距离一旦拉远,收音效果就不理想。
如果是在封闭的环境中,还会形成混响。
周围有噪音,或是设备自己正在播放音乐,还要解决噪声问题……在这样的中远距离环境中发生的语音识别,被称为远场识别(Far-field Speech Recognition)。
通常我们会使用“麦克风阵列”解决远场识别问题。
“麦克风阵列”由两个以上的麦克风组成,直线、环形或是球状,布置方法各不相同。
通过彼此之间的距离差所造成的接收到的声波差异,可以了解声源的位置定向增强,从而提升收音效果;同时抑制其他方向的“声音”,来解决房间混响和噪声问题。
除了硬件,语音识别模型往往使用近场语音数据训练而成。
如果替换成远场数据重新训练,也能提升识别效果。
除了依靠麦克风阵列,也有纯粹依靠深度学习算法解决问题的流派,不过目前大部分智能音箱都在使用麦克风阵列。
KnowingAI知智更懂人工智能行业的知识传播者认证作者已在发表 79 篇文章