Aug, 2023

基于人类注意力辅助的航空视觉与对话导航的多模型融合

TL;DR发展能够与人类交流并遵循自然语言命令的智能无人机,该研究提出了一种基于 AVDN 数据集的高效融合训练方法,使用 HAA-Transformer 模型和 HAA-LSTM 模型,对导航路由点和人的注意力进行预测,并在 SR、SPL 指标上取得高效果,相比基线模型,GP 指标有 7% 的改进。