BriefGPT.xyz
Ask
alpha
关键词
multimodal event transformer
搜索结果 - 1
ACL
多模态事件转换器用于图像引导的故事结尾生成
提出了一种基于多模态事件转换器的图像引导故事结尾生成方法,该方法利用事件图、跨模态融合和事件推理等技术从故事情节和结尾图像中推导隐含信息,并在解码器中适应性地注入必要信息,实验证明其在故事结尾生成方面性能优于现有方法。
PDF
a year ago
Prev
Next