Sep, 2023

资源受限机器人的混合 ASR:HMM - 深度学习融合

TL;DR提出了一种新颖的混合自动语音识别(ASR)系统,专为资源受限的机器人设计。该系统将隐马尔可夫模型(HMM)与深度学习模型相结合,并利用套接字编程来有效地分配处理任务。通过在机器人内部进行基于 HMM 的处理,同时由独立的计算机处理深度学习模型,实现了 HMM 和深度学习之间的协同,显著提高了语音识别准确性。通过在各种机器人平台上进行实验,演示了实时精确的语音识别能力。该系统在适应不断变化的声学环境和兼容低功耗硬件方面具有灵活性,使其在计算资源有限的环境中非常有效。这种混合 ASR 范式为无缝人机交互提供了有前景的可能性。总之,我们的研究为针对机器人的 ASR 技术引入了一种开创性的维度。通过利用套接字编程在不同设备上分配处理任务,并巧妙地组合 HMM 和深度学习模型,我们的混合 ASR 系统展示了它在使机器人能够熟练理解和响应口语,甚至在计算资源受限的环境中的潜力。这种范式在各种现实场景下提升人机交互的创新方向。