- 机器实验语用学:测试 LLM 关于简单与嵌入式选择推理的预测
通过与人类实验结果进行对比,使用先进的大型语言模型预测,本研究关注明确和嵌入的分明性推论以及常规数量意涵的三种推论,并发现模型结果与人类实验结果在这些推论的大幅差异以及精细差异方面基本一致。
- GPT-4 在至少跟人类一样理解语篇
GPT-4 与人类在标准化的议论理解测试中表现相近,都对故事中暗含的信息具有强大的推理能力。
- MM答案集编程中的人类条件推理
给定一个条件句 P=>Q(如果 P 则 Q)和相应的事实,观察到人类推理中的四种不同类型的推断:肯定前提(AA)从 P 推出 Q;肯定结论(AC)从 Q 推出 P;否定前提(DA)从 - P 推出 - Q;否定结论(DC)从 - Q 推出 - 通过蒸馏将知识更新传递给 LM
文章介绍了建立语言模型的知识库的更新方法,通过上下文蒸馏的方式对实体进行继承知识,以良好的效果进行更新,而不会影响到性能。
- 为什么要逐步思考?推理出自于体验的本地性
使用语言模型探究推理何时及为何有帮助,得出推理步骤的有效性取决于训练数据的统计结构和中间变量与目标推理之间的相关性。
- EMNLPTransformer 能否在自然语言的片段中进行推理?
本文对深度学习在自然语言处理(NLP)方面的最新应用进行了调查研究,发现 transformer-based language models 在检测受控自然语言片段的有效推理方面表现出明显的过拟合问题,未能获取主导推理的逻辑原则。
- 文本丰富化的密集复述
本文提出了 Dense Paraphrasing(DP)这一文本表征转化的过程,即通过对文本表达(词汇或词组)进行重写以减少歧义并使底层语义得到明确的阐述,从而改善推理和问答任务性能。同时,作者介绍了第一个完整的 DP 数据集及注释任务的范 - MM概率逻辑编程中的程序解释
该研究提出了一种新方法,利用概率逻辑编程模型来生成精简且有因果结构的解释程序,使得用户可以根据可视述词并隐藏不感兴趣的细节。
- COLING注意空缺!注入常识知识,用于抽象对话摘要
本论文提出了一种利用对话共享常识知识的唯一特征来解决总结难题的方法,介绍了 SICK 框架,该框架使用常识推理作为额外上下文,比先前仅依赖于输入对话的工作更具优势,实验证明注入常识知识后,我们的框架生成的总结比现有方法更具信息性和一致性。
- 定性概率网络中的正依赖关系
本文研究了定性概率网络中的对称性质问题及其对非二元 QPN 的推断的影响并给出了可能的解决方案。
- ACL跨模态统一建模技术用于字幕生成
该论文利用与计算模型相关的连贯性关系研究了图像字幕生成的信息需求和目标,通过特定的协议,获取 10,000 个图像与字幕的连贯性关系,将其用于学习推理的新任务,得到的结果显示,通过连贯性关系提高了生成的字幕的一致性和质量。
- ACL从英语新闻标题中推断计算
本文提出并实现了一种从英语新闻标题中计算推理的方法,利用标题的句法结构来计算与新闻背景无关的推断。这些推断可以有助于评估新闻标题对读者(包括孩子)的影响,了解社会状况的可理解度取决于标题的消化。
- ICML关于对个体进行数据驱动的推论时增强透明度和控制力
本文通过分析社交网站(如 Facebook)上可被利用用以预测个人特征的信息,提出了一种能够提供对某些统计模型中对用户的推断的透明度以及控制来隐瞒个人信息以控制信息泄露的方法,并利用该方法检查用户是否能够真正实现这一隐私保护的目标。在应用于 - 大规模知识图谱的基于列的 Datalog 实体化 (扩展技术报告)
本文介绍了一种新的 Datalog 推理物化方法,将基于列的内存布局与避免运行时冗余推理的新型优化方法相结合,进一步提高了效率,并通过有预测性的缓存某些子查询,实现了在受限资源下甚至可以与最先进的系统的性能相匹配的结果。