机器也有 除了依靠麦克风阵列

ID:35332 / 打印

“远场识别”是什么?神奇的“麦克风阵列”又是什么?本文来自微信公众号:KnowingAI知智(ID:Knowing_AI),作者:虞喵喵。

对着手机讲话识别效果很好,可是距离远一点,再离远一点呢?距离一旦拉远,收音效果就不理想。

如果是在封闭的环境中,还会形成混响。

周围有噪音,或是设备自己正在播放音乐,还要解决噪声问题……在这样的中远距离环境中发生的语音识别,被称为远场识别(Far-field Speech Recognition)。

通常我们会使用“麦克风阵列”解决远场识别问题。

“麦克风阵列”由两个以上的麦克风组成,直线、环形或是球状,布置方法各不相同。

通过彼此之间的距离差所造成的接收到的声波差异,可以了解声源的位置定向增强,从而提升收音效果;同时抑制其他方向的“声音”,来解决房间混响和噪声问题。

除了硬件,语音识别模型往往使用近场语音数据训练而成。

如果替换成远场数据重新训练,也能提升识别效果。

除了依靠麦克风阵列,也有纯粹依靠深度学习算法解决问题的流派,不过目前大部分智能音箱都在使用麦克风阵列。

KnowingAI知智更懂人工智能行业的知识传播者认证作者已在发表 79 篇文章

上一篇: 家族企业 与二代所处的环境不同
下一篇: 大学是如何录取考生的 其中本科提前批十人

作者:admin @ 茹曜信息网   2024-09-02

与本文相关文章