心理学引导的可控故事生成
本文提出了一种基于多字符心理线的故事生成模型 SoCP,通过注意力机制实现不同角色心理状态的转变控制, 并引入一种新的心理状态控制度量来评估模型效果。实验结果表明该模型能够自动生成包括多个角色、丰富的情感变化的故事。
Oct, 2020
本文提出了一个新的任务 —— 风格化故事生成,即在给定前导的情况下生成带有指定风格的故事,并提出了一种新颖的生成模型来解决这个问题,该模型首先规划出风格化关键词,然后在关键词的指导下生成整个故事。此外,提出了两种自动度量标准来评估所生成的故事与指定风格之间的一致性。实验证明,我们的模型能够根据 ROCStories 数据集(Mostafazadeh et al.,2016)可控地生成情感驱动或事件驱动的故事,为进一步研究风格化故事生成提供了见解。
May, 2021
本文通过加入预训练模型 CLIP 和 GPT-2 解决数据稀缺性问题,加入风格适配器控制故事生成,尝试解决从图像到故事的生成难题,实现了包括非风格化、浪漫和动作等多种风格的故事生成。结果表明,该方法改善了故事的连贯性和图像与故事的相关性,但风格仍有待改进。
Sep, 2022
本文提出 CONPER 模型,以控制主角人物的性格,生成一个情境和人物描述的故事,并通过事件序列展示指定的性格特征。自动和手动评估结果表明,CONPER 模型在生成更连贯和可控的故事方面优于现有基准。
Apr, 2022
我们提出了一个控制生成多个不同输出的简单有效建模框架,重点考虑了情感、长度、谓语、语义框架和自动诱导簇等几个句子属性。我们的实验结果表明:(1) 我们的框架在产生与目标控制值匹配的输出方面非常准确;(2) 与标准的 n-best 列表生成相比,我们的模型产生的最大指标得分要高;(3) 控制语义框架的生成方式能够产生更强的多样性和质量,其自动度量分数也更高。我们还进行了人类评估,以评估为创意写作提供多个建议的效用,在协作写作系统中实现可控性、多样性的生成具有很大的潜力。
Sep, 2019
自动视觉化故事生成包含了自然对话生成和图像生成两个部分,其中,系统通过用户指定的关键词和情绪标签生成下一个句子,再用扩散模型生成相应的图像。此外,通过对象识别技术,生成的图像中的物品可被用于未来的故事发展。
Jan, 2023
本文提出了一种可控的神经生成框架,它可以利用个人命名实体规划灵活引导对话摘要生成。条件序列被调节以决定何种类型的信息或者何种角度着重于形成摘要,以解决摘要任务中的低限制问题。实验结果表明,我们提出的框架使用各种规划控制生成流畅和事实正确的摘要。
Sep, 2021
本文介绍了一个新的框架 MEGATRON-CNTRL,通过结合外部知识库,利用大规模语言模型实现生成文本的控制,并由关键字预测器,知识检索器,上下文知识排名器和条件文本生成器四个部分组成。实验结果表明,相较于之前的 ROC story 数据集,该模型生成更加流畅、一致、连贯且重复率低,差异性高的故事,使用新关键词进行控制后,人类评价结果表明 77.5% 的故事已经成功受到了控制。同时,由 124million 经验推广到 8.3billion 再次展示了大规模模型提高生成质量和控制性能的过程。
Oct, 2020
本文提出了一种基于自回归扩散模型和视觉记忆模块的方法,利用软注意力机制实现了参考解析和场景、角色的一致性维护,用于生成与故事一致、质量高的帧画面,并在多句子情节的数据集上进行了实验验证。
Nov, 2022