Sep, 2023

一种基于 Pepper、Lightweight-Transformer 和 LLM 的手语识别系统

TL;DR本研究旨在使用轻量级深度神经网络架构,使人型机器人 Pepper 能够理解美国手语(ASL),促进非语言人机交互。我们首先介绍了一个针对嵌入式系统进行了优化的轻量级高效 ASL 模型,可以在保留计算资源的同时快速识别手势。其次,我们运用大型语言模型(LLMs)进行智能机器人交互。通过精心设计的提示工程,我们能够实现 Pepper 机器人生成自然的共语手势回应,为更有机、直观的人机对话奠定基础。最后,我们提供了一个集成的软件管道,体现了社交意识型人工智能交互模型的最新进展。利用 Pepper 机器人的能力,我们在实际场景中验证了我们方法的实用性和有效性。结果突出了通过非语言交互增强人机交互的巨大潜力,缩小沟通差距,使技术更易接近和理解。