将口语个人叙述分解为叙述子句类型,探索它们之间相似性的方面
本文研究关系人物之间的情感极性特征,并提出结构化预测和聚类方法来解决该问题,在语言和语义特征的基础上,通过社交网络结构来提高模型性能。作者在维基百科电影概要数据集上验证了模型的优越性。
Dec, 2015
我们介绍了一个新的语料库,PersonaBank,由108个带有它们的故事意图图注释的个人博客故事组成,描述了这些故事的主题和基于故事意图图表达的深层表示,以及注释故事以产生故事意图图表的过程和适应这个新个人叙述域的挑战,我们还讨论了如何在应用中使用这个语料库,通过不同风格的讲述或作为内容规划器复述故事。
Aug, 2017
该研究介绍了一个新的任务,使用NLP系统自动推断个人叙述中寻求建议的目的,构建了一个包含20,000多个人体验的数据集,并利用人类注释确定该任务需要应用人类的常识和社交智慧。
Apr, 2019
本文探讨通过利用已有的故事数据集,将背景故事加入人物角色,通过基于梯度的重写技术,使生成的响应流畅、差异最小,并与原始人物角色保持一致,实现对话模型人性化和丰富性的提高。
Jun, 2021
本文提出了一种计算模型,通过分析角色猜测的心理状态和句法和语义层面的语言信息,自动检测叙述结构的主要元素。通过使用预先训练的社交常识知识模型获取主角的心理状态信息,并使用多功能融合方法将其与语境语义嵌入相结合,我们建立了一个包含手动注释的STORIES数据集的计算模型来实现这一任务,并在评估中发现我们的模型能够实现极显著的改进来识别高潮和结局。
Feb, 2023
通过构建包含 ~100K 经人类验证的人物相关事实的大型 commonsense 知识图谱 PeaCoK,该研究工作对五个人物知识维度进行了总结并提炼,能够帮助下游系统生成更一致和引人入胜的叙事。
May, 2023
本篇研究提出一种基于共情共鸣的个人故事相似度计算方法,通过对个人故事中的主要事件、情感轨迹和总体价值等三个特征进行操作来得出共情相似度得分,并使用1500个故事和2000对故事进行了数据集制作与模型的训练,最终证实了基于共情的相似度计算模型不仅在数据检索表现方面媲美基于词汇语义的模型,还能有效地促进人与人之间的情感共鸣与联系。
May, 2023
用“Anthology”方法,通过使用“backstories”以特定的虚拟人物为特征来调节LLMs,以提高实验结果的一致性和可靠性,并确保更好地代表多样的亚人群。
Jul, 2024
本研究针对叙事理解领域中对人物与属性的识别和描述的问题,构建了CHATTER数据集,涵盖了2998个角色和13324个属性,标注了88148对角色-属性关系。这一数据集为评估叙事模型对人物发展的理解提供了可靠的基准,特别是通过ChatterEval验证其在电影剧本中的应用潜力。
Nov, 2024