- ExU:检测多语言虚假信息叙事并理解其传播
ExU 项目研究在线虚假信息,跨语言分析叙述以帮助事实核查人员和记者筛选大量数据。项目侧重于开发基于人工智能的多语言虚假信息分析模型,解决谣言立场分类和索取索赔的任务。我们描述了 ExU 项目提案,并总结了有关支持事实核查工具设计的用户要求 - COLING分支叙述:角色决策点检测
该论文介绍了 Character Decision Points Detection (CHADPOD) 任务,该任务用于识别叙述中人物做出可能对故事发展产生重大影响的决策点。我们提出了一个基于 CYOA 游戏图的新颖数据集,可作为该任务的 - 评估计算机提取的叙事地图编码媒体框架的能力
通过新闻数据,探索使用特定故事提取和表示方法(故事地图)捕捉其框架信息的能力,结果表明,虽然该算法捕捉了框架的分布,但在不同开始和结束事件中实现一致的框架存在挑战,同时强调了故事地图揭示新闻故事中错综复杂的框架动态的潜力,但直接利用框架信息 - 迷失于递归中:在知识图谱中挖掘丰富的事件语义
复杂事件的故事、事件中心的知识图谱、增量提示技术、概念验证的有效性和未来研究方向。
- 回归起点:生成具有相关终点的叙事
RENarGen 是一种可控的故事生成方法,通过确保首尾句子的相关性并填补中间句子,生成具有更好故事性闭环的故事,相关方法探索中包括书写学对语言模型的影响。
- 使用结构化叙述提示生成的 GPT-4 人生事件叙述:验证研究
通过使用 OpenAI 的 GPT-4,使用零样本结构化叙述提示生成了 24,000 个叙述,然后手动分类和评估它们在传达出生、死亡、雇佣和解雇事件方面的有效性。在九种机器学习模型中,所有模型在将有效叙述分类为有效方面表现出色,但同时在将无 - CRAB:评估现实世界事件之间因果关系的强度
通过引入 CRAB(Causal Reasoning Assessment Benchmark)来评估自然语言处理中事件因果关系的理解能力,发现大部分语言模型在复杂因果结构中的因果推理上表现不佳。
- EMNLP情感与动态束搜索的故事生成
通过引入动态波束调整和情感重新排序两种新技术,我们提出了情感故事生成器(AffGen)来生成有趣的叙述,实证评估证明了 AffGen 在生成情感充沛和有趣的叙述方面的优越性能。
- EMNLPStoryAnalogy: 从大型语言模型获取故事层面类比以解锁类比理解
评估了通过构建首个大规模故事级类比语料库 StoryAnalogy 来识别和生成类比的能力,并发现类比识别任务对于句子嵌入模型和最近的大型语言模型(LLMs)都具有极高的挑战性。最终发现 StoryAnalogy 中的数据可以提高 LLMs - 实验叙述:人类众包叙事与人工智能叙事的比较
本研究提出了一种结合行为和计算实验的框架,利用虚构提示作为一种新颖工具,研究人类和生成型 AI 在叙事中的文化产物和社会偏见。通过分析人类和大型语言模型对创建并与人工智能恋爱的相同提示的回应,实验证明了 Pygmalion 神话在人类和大型 - ARN:故事类修辞推理的综合框架和数据集
通过将认知心理学中的类比推理理论在叙述上进行计算适应,我们提出了类比叙事(ARN)数据集和一个大规模的评估框架,研究了不同抽象程度的类比、不类比之间的匹配。研究结果表明,当较高级别的映射缺乏较低级别的映射时(远类比),大语言模型难以识别;而 - 故事告诉我!基于大语言模型的叙事驱动可解释人工智能
利用大型语言模型,引入了 XAIstories,通过 SHAP explanations 和 counterfactual explanations 为 AI 预测提供直观的解释。研究结果表明,XAIstories 可能成为真正解释和理解 - 在线讨论中集体叙事位移的发现
本研究提出了一种系统的叙述性发现框架,通过改变点检测、语义角色标注(SRL)和叙事片段的自动聚合来解决大规模文本下叙述性的提取,并在两个 Twitter 语料库中评估了我们的模型,结果表明我们的方法可以恢复相应于重大事件的主要叙述转变。
- 新事物?识别叙述中新事件的展开
研究了叙述文本的事件信息状态和新事件的自动识别,提出了一种新的挑战性任务,定义事件为主语、谓语和宾语三元组,并用人类注释者对其中的新事件进行了注释和验证,并发布了相应的注释数据集和机器学习基线模型。
- 将常识世界模型注入图谱知识
本文研究在一个开放式世界的文本冒险游戏中生成叙事的设定,使用游戏状态的图形表示来训练模型,可以消耗和输出基于图形的表示和自然语言描述和动作。通过结合众包和模拟游戏玩法构建一组大量的任务和复杂的动作数据集来构建这样的模型,发现通过在图形上下文 - 寻找不可证伪声明中的结构
本文介绍了一种人机交互的方法 PAPYER,用于从社交媒体平台上的评论中提取关于卫生的核心故事,并通过结合机器和人的核心方法,发现了一些预备故事线,优于最近的大型变压器模型和最先进的无监督主题模型。
- ACLTellMeWhy: 一个用于解答叙述中 Why 问题的数据集
介绍了 TellMeWhy 数据集,该数据集包含超过 30k 个关于短篇小说角色为何采取某些行动的问题和自由格式答案。通过对最先进模型的评估表明,它们在回答需要外部常识知识支持的问题上远远低于人类表现。
- 零样本常识问答的动态神经符号知识图谱构建
通过动态生成常识知识图谱,我们提出了一种零 - shot 通识问答的方法,能够推理涉及文本场景中因果关系、影响和状态等方面的隐含世界知识,并实现了生成语义知识结构的功能,从而有效地推理出正确答案。
- EMNLP反事实故事推理和生成
本文提出了一种反事实的故事重写模型,用于通过改变故事的最小部分,使其与另一事件相容,并介绍了一种新的可用于评估该模型的数据集 TimeTravel。
- EMNLPCosmos QA: 带有上下文常识推理的机器阅读理解
本文介绍了 Cosmos QA,这是一个大规模的基于常识的阅读理解数据集,旨在帮助机器阅读人们日常故事时理解其中的隐含意思,并提出了一种新的神经网络结构来处理此类问题。实验结果表明,机器与人类的阅读理解性能存在明显差距,因此还需要进一步研究