BriefGPT.xyz
Ask
alpha
关键词
film blocks
搜索结果 - 1
AAAI
从 FiLM 到视频:多模态背景下的多轮问答
通过 AVSD 挑战,本文提出了一种层次化编码 - 解码模型来回答有关视频的问题,采用预训练的 I3D 和 VGGish 模型计算视频及音频帧的语义特征,并使用 FiLM 块进行条件编码以降低维数,最终使用 LSTM 解码器通过计划采样进行
→
PDF
6 years ago
Prev
Next