BriefGPT.xyz
Ask
alpha
关键词
sequential vision-to-language
搜索结果 - 2
ACL
以人物为中心的叙事
该研究利用 VIST 数据集,提出了一个模型,通过隐式学习提供的角色之间的关系,生成关注的角色的故事,旨在解决基于图像序列生成故事时,模型忽略可能存在的人和动物角色的问题。
PDF
5 years ago
ACL
视觉叙事
首个序列视觉语言数据集的发布,这个数据集中包含 81,743 张唯一图片和 20,211 个序列,旨在探讨其在视觉叙事任务中的应用,建立多个强劲的基础模型以及推动基于自动度量标准的进展,为模拟具象和比喻、社交语言提供了可能,从而推动人工智能
→
PDF
8 years ago
Prev
Next