Jun, 2023

基于活跃稀疏对话的音视频体感导航改进

TL;DR提出了一个交谈式的视听代理机器人 CAVEN,该机器人能够使用多模态强化学习来帮助人 / 预测正确的下一个动作并提出问题,并在语音搜索过程中与人 / 专家互动,尤其在定位新的声源时性能更优。