Mar, 2024

通过故事讲述栩栩如生的故事:一个富有表达力和流畅的多模式讲故事者

TL;DR基于图像流生成合理和生动的故事情节的多模态的人类水平故事生成方法 LLaMS 通过充分利用 LLM 中的常识知识,首先采用序列数据自动增强策略来增强实际内容表达,并利用文本推理架构进行表达性故事生成和预测;其次,我们提出故事插图生成的 SQ-Adapter 模块来保持序列一致性。通过人工评估验证了 LLaMS 提出方法的优越性,与之前的 SOTA 方法相比具有最先进的故事性能,具有 86% 的相关性和 100% 的一致性胜率。此外,还进行了消融实验以验证所提出的序列数据增强和 SQ-Adapter 的有效性。