BriefGPT.xyz
Ask
alpha
关键词
video-grounded dialog
搜索结果 - 1
揭示隐藏的关联:针对与视频相关的对话进行迭代跟踪和推理
对比传统的视觉问答,基于视频的对话需要深入理解对话历史和视频内容以实现准确的响应生成。为了解决现有方法在逐步理解复杂对话历史和融入视频信息方面所面临的挑战,我们提出了一种迭代的跟踪与推理策略,将文本编码器、视觉编码器和生成器相结合。在核心部
→
PDF
9 months ago
Prev
Next