BriefGPT.xyz
Ask
alpha
关键词
multi-modal attention-based dialog state tracker
搜索结果 - 1
COLING
OLViT: 基于注意力嵌入的视频对话多模态状态追踪
我们提出了 Object Language Video Transformer (OLViT) - 一种新颖的视频对话模型,它在基于多模态注意力的对话状态跟踪器上运行。OLViT 通过维护基于对象状态跟踪器 (OST) 和语言状态跟踪器 (
→
PDF
5 months ago
Prev
Next