BriefGPT.xyz
Ask
alpha
关键词
video-grounded dialogue generation
搜索结果 - 2
M2K-VDG: 模型自适应多模态知识锚定增强的视频驱动对话生成
通过计算困惑度,我们揭示了不同的视频对话生成(VDG)模型经历了不同的幻觉,并展示了多样的锚点标记。基于这一观察,我们提出了一种模型适应性的多模态知识锚点增强框架 M2K-VDG,用于减少幻觉产生。进一步,我们引入了反事实效应以更准确地检测
→
PDF
5 months ago
EMNLP
视频对话生成中的多模态语义图协同推理
本文研究了基于视频对话生成,提出一种方法,可以将视频数据集成到预训练语言模型中,通过多模态推理实现各种模态之间的互补信息,实验结果表明,该模型能够在自动和人工评估方面显著优于现有的最先进模型。
PDF
2 years ago
Prev
Next