BriefGPT.xyz
大模型
Ask
alpha
关键词
peak attention loss
搜索结果 - 1
MLANet:基于子指令的多级注意力网络,用于连续的视觉语言导航
为了更好地在连续的虚拟现实环境中实现语音导航,本文提出了一个多层次的指令理解机制和一个名为 MLANet 的新模型,它包含子指令生成的快速算法 (FSA)、多层次关注模块 (MLA) 来调和指令和视觉信号,以及用于提高对当前子指令选择能力的
→
PDF
a year ago
Prev
Next