将口语个人叙述分解为叙述子句类型,探索它们之间相似性的方面
本篇研究提出一种基于共情共鸣的个人故事相似度计算方法,通过对个人故事中的主要事件、情感轨迹和总体价值等三个特征进行操作来得出共情相似度得分,并使用 1500 个故事和 2000 对故事进行了数据集制作与模型的训练,最终证实了基于共情的相似度计算模型不仅在数据检索表现方面媲美基于词汇语义的模型,还能有效地促进人与人之间的情感共鸣与联系。
May, 2023
该研究介绍了一个新的任务,使用 NLP 系统自动推断个人叙述中寻求建议的目的,构建了一个包含 20,000 多个人体验的数据集,并利用人类注释确定该任务需要应用人类的常识和社交智慧。
Apr, 2019
本研究提出了一种结合行为和计算实验的框架,利用虚构提示作为一种新颖工具,研究人类和生成型 AI 在叙事中的文化产物和社会偏见。通过分析人类和大型语言模型对创建并与人工智能恋爱的相同提示的回应,实验证明了 Pygmalion 神话在人类和大型语言模型的集体想象中一直存在的普遍存在。分析揭示了 GPT-3.5 和特别是 GPT-4 的叙事在性别角色和性取向方面比人类更加进步。虽然人工智能的叙事偶尔会提供创新的情节转折,但其提供的情境和修辞比人类的文本更缺乏想象力。该提出的框架认为小说可以作为了解人类和基于人工智能的集体想象和社会维度的窗口。
Oct, 2023
本文介绍了一种将 Scheherazade 故事意图图转换成人物 NLG 引擎所需输入的自动方法,使用 36 个 Aesop 寓言进行测试,结果表明我们可以生成正确内容,平均与 Scheherazade 实现器的输出接近。
Aug, 2017
本研究介绍了一种名为 NEAT 的新型 NLP 任务,针对新闻等信息文本,基于 Labov 和 Waletzky 的叙事理论设计了一种新的多标签叙事注释方案,标注了从多种类别域收集的 46 篇新闻文章中的 2,209 句子,并训练了多个监督模型进行不同设置的分类,成功地识别了不同的叙事元素,并达到了高达 0.77 的 F1 分数,表明该研究具有很好的全面性及对域类别的鲁棒性。
Oct, 2022
本文研究关系人物之间的情感极性特征,并提出结构化预测和聚类方法来解决该问题,在语言和语义特征的基础上,通过社交网络结构来提高模型性能。作者在维基百科电影概要数据集上验证了模型的优越性。
Dec, 2015
这篇论文利用自然语言处理技术研究了大规模的大屠杀幸存者见证集,将见证转化为结构化问题和答案,通过主题建模方法发现了关键主题并分析了不同年龄和性别组之间的差异和相似之处,进而揭示了见证集中主题的演化和幸存者经历中的潜在变异。
May, 2024
训练自然语言处理系统以深入理解语言是该领域的中心目标之一。本文从人类大脑理解自然语言的角度出发,研究了使用叙述数据集进行深层次叙事理解训练的语言模型是否真正学习了更深层次的文本理解,并表明了这种训练可以带来更好的大脑 - 自然语言处理对齐性、可以使语言模型在长距离文本理解方面取得改进。
Dec, 2022
本文提供了一个包含 445 篇人工和计算机生成的文档的语料库,其中包含约 27,000 个从句,注释了语义从句类型和相关关系,以便对人工和自然语篇模式进行微妙的比较。它涵盖了正式和非正式的话语,包括使用 Fine-tuned GPT-2 和 GPT-3 (分别为 Zellers 等人 2019 年和 Brown 等人 2020 年发表的技术) 生成的文档。通过提供初步的证据,我们展示了该语料库对于对生成文本进行详细的话语分析的有用性:较少数量、更短和更不连贯的从句关系与计算机生成的叙述和论述的较低感知质量相关联。
Nov, 2021