BriefGPT.xyz
大模型
Ask
alpha
关键词
audio-visual scene-aware dialogues
搜索结果 - 1
ACL
利用预训练生成语言模型的视频对话
本文提出了一种基于 GPT-2 模型的框架,将视频与文本表示结合成连续、有结构的序列,并利用其 fine-tuning 能力来解决视频对话中的挑战,从而在 Audio-Visual Scene-Aware Dialogues 基准测试中取得
→
PDF
4 years ago
Prev
Next