- 机器实验语用学:测试 LLM 关于简单与嵌入式选择推理的预测
通过与人类实验结果进行对比,使用先进的大型语言模型预测,本研究关注明确和嵌入的分明性推论以及常规数量意涵的三种推论,并发现模型结果与人类实验结果在这些推论的大幅差异以及精细差异方面基本一致。
- COLING构造难题之难即使对于大语言模型也因错误原因而被解决
我们通过引入具有大量词汇重叠的自然语言推理的小型挑战数据集,从 NLP 的角度出发,展示了 GPT-4 和 Llama 2 在此方面的失败,同时从计算语言学的角度,我们发现一组无法通过表面特征区分的三类形容词结构,进而探索 LLM 对这些结 - 通过下一个词预测学习语义能力的可行性研究 —— 以蕴涵为例
理论上,LMs 通过其训练数据中的共现模式推导文本的语义信息;本研究调查其理论是否可用于从神经 LMs 中解码蕴含关系,结果显示与他们类似的测试可以在多个数据集和 LMs 上解码语义蕴含关系,这表明 LMs 隐含地建模了语义方面以预测句子共 - ACL偏执是强健的自学习者
本研究设计了一种提示策略,将多个 NLU 任务作为上下文蕴含进行推断,并提出了简单伪标签编辑算法(SimPLE)以提高自我训练的伪标签质量,在二分类和多分类分类任务上进行的实验表明,自我训练蕴含模型在语言理解任务上比大型语言模型更有效和可信 - ChatGPT 与简单语言推理:盲点和缺陷
研究探讨了 ChatGPT 在理解语言方面的局限性,着重于对于通常对人类来说很容易但对该模型来说具有挑战性的简单推理任务的限制,研究结果表明,虽然 ChatGPT 在某些领域具有语言理解的能力,但是其对于一些特定类型的蕴含有所盲区,该研究强 - 在具有典型性条件逻辑中对多层感知器的优先解释
研究了知识表示缺陷推理的多重优先语义与多层神经网络模型之间的关系,通过多重优先语义对多层感知器进行了偏好解释,并利用模型检查和蕴含性方法验证了条件属性。
- 有限宽度反模理论的一阶查询可决定性
提出了一个通用的查询决策框架,基于计数模型的结构简单性,可以确定各种逻辑蕴涵问题(简称查询)的可决性,其中 Blumensath 的分区宽度作为一个特别强大的宽度度量提出,重点介绍存在规则的形式化,其中分区宽度的规则子域覆盖范式为一周围侧子 - 经验人工智能研究中基准排名的零样本蕴含
这篇论文探究了零样本学习的现象在特定的文本蕴涵识别 (RTE) 任务类别中的应用,即自动挖掘带有实验证据的人工智能研究排行榜。作者通过实验检验两个现有最先进的模型是否具有泛化能力或者蕴涵的显现能力,进一步提出了零样本标签数据集的构建方法。
- AAAI学习记忆蕴涵和语篇关系以实现一致的人物对话
本研究提出了一种学习记忆包含关系和对话关系以实现人物 - 一致性对话任务的方法,通过自然语言推理数据集中的包含文本对应用于前提 - 假设生成任务,学习隐含包含关系,同时以类似架构的内存应用于对话中的话语信息,这两个记忆空间的正交性限制确保隐 - EMNLPDREAM-FLUTE:借助梦幻长笛理解比喻语言
提出了一种名为 DREAM-FLUTE 的比喻语言理解系统,它通过构建 “mental model” 来实现理解,将场景描绘成意义明确的语言,以此来实现事件推理,并取得了非常好的结果。
- EMNLPEntailer: 用真实和忠实的推理链回答问题
本研究旨在设计一个问题回答系统,通过系统的推理链条,向外呈现模型回答问题的内部思路过程,并通过回答问题的命题来验证模型是否真正信奉这些命题。本文所提出的系统能够产生多步,忠实和真实的推理链条,能够使人更好地理解模型的判断和思维方式,为纠正和 - 使用 Transformer 语言模型对社会政治文本进行零样本排序以减少读取时间
使用基于 Transformer 的 DeBERTa 模型将分类问题转化为蕴含问题,使得排名最高的文档可以被视为正分类文档,从而缩短信息抽取过程中的阅读时间,并发现一定的召回率下,使用声明性形式的类别标签作为查询可以优于使用字典定义的类别标 - 从理想语言模型中提取蕴涵语义
本文探讨了使用 Gricean 数据训练语言模型,能够推断出句子之间的蕴含关系,并揭示了从无标签语言数据中提取语义信息的潜在框架。
- 代表系统理论:一种统一的编码、分析和转换代表的方法
该研究提出了一种新的理论 -- 代表性系统理论,通过结构变换技术,将一个系统中的表达方式变换到另一个系统中,从而通过统一的方法编码和选择代表性,具有广泛实用价值。
- 零次和少样本学习用于作者分析
本文从低资源的角度研究作者特征分类,在西班牙语和英语中尝试了不同的零样本和少样本模型,发现基于蕴涵的模型优于基于 roberta-XLM 的监督文本分类器, 并且使用少于 50% 的训练数据平均可以达到先前方法准确率的 80% 以上。
- EMNLP通过语句组合搜索进行自然语言推理
本文提出了一种基于自然语言的演绎推理系统,通过将任务分解为逐步协调的步骤,并由搜索程序生成中间结论的树,可以成功地证明真实的语句并拒绝虚假的语句。
- 基于少样本学习的蕴涵推理
本研究提出了一种名为 EFL 的新方法,将潜在的自然语言处理任务重新表述为蕴含任务,并在少至 8 个样例的情况下微调模型,进而证明该方法可以自然地与无监督对比学习数据增强方法相结合,易于扩展为多语言少样本学习,并在 18 个标准 NLP 任 - ACL愚我无二:基于维基百科游戏化的蕴含关系
通过一款多人游戏收集了大量具有挑战性的蕴涵数据对集合 FoolMeTwice,通过游戏化大幅降低了使用 “捷径” 解决问题的数量,并得出高质量的数据,其玩法之间的竞争促进了更多多样化策略的运用,如时间推理和转移无关证据。
- EMNLP依存层面蕴涵在生成中的事实性评估
本文提出了一种新的蕴含形式,即在依赖弧的级别上对其进行分解,以便更好地检测文本生成模型中的事实不一致性。实验证明,基于依赖弧的蕴含模型可以更好地识别重新表述和摘要中的事实不一致性,并在定位错误部分方面具有优势。
- IJCAI贝叶斯蕴含假设:大脑实现单调和非单调推理的方式
该论文探讨了大脑是贝叶斯机器的假设,给出了一种基于 Bayesian 算法和数据结构的逻辑推理方法,并详细描述了它们的抽象推理属性及优点。