- 肯定安全:高风险人工智能的风险管理方法
AI 专家建议在高风险的人工智能系统开发或部署之前,公司应该要求展示这些系统的安全性。本文旨在扩展这个想法并探讨其对风险管理的影响。我们认为开发或部署高风险人工智能系统的实体应该提供积极安全的证据,并确保其活动将风险保持在可接受的阈值以下。
- COLINGRU22Fact:俄乌冲突国际化可解释事实核查的证据优化
基于大型语言模型,从网络中自动检索和总结证据,以解决可解释的事实检查系统中提供足够和相关证据的挑战,并通过 RU22Fact 构建一个新颖的多语言可解释的事实检查数据集,基于该数据集开发出了一个端到端的可解释的事实检查系统,实验结果表明优化 - CBGT-Net:面向流数据的鲁棒分类的神经构型
这篇论文描述了 CBGT-Net,这是一个受到哺乳动物大脑中的皮层 - 基底节 - 丘脑(CBGT)回路启发的神经网络模型。与传统的神经网络模型不同,该模型在观察到的数据流中学习在达到足够证据标准后产生输出。我们通过两个图像分类任务对该模型 - 合理的顺序决策的奖励设计
我们提出了一种基于辩论的奖励模型,用于训练可证伪的策略,该策略的决策可以更容易地与支持证据相印证。我们通过多智能体的辩论训练显示,代理人学会提出抗驳且与人类偏好密切一致的证据。
- 多项选择阅读理解的多层次证据推理
提出了一个新颖的通用模型增强方法,称为多粒度证据推断器(Mugen),该方法能够综合地提取粗粒度、中粒度和细粒度的证据,并将证据与原始文章整合,从而在四个多选 MRC 基准测试中实现了显著且一致的性能改进。
- ChatGPT 在归因答案时出现幻觉
ChatGPT 的答案在一半情况下是正确或部分正确的,但是其提供的支持性参考仅有 14% 存在,并且对其所提供的参考进行的分析揭示出通用的特征,即使模型提供的参考确实存在,该参考通常也不能支持 ChatGPT 所归属的要求。
- ACL提供更多细节:利用潜在检索改进事实核查
该研究旨在改善自动事实核查系统,并尝试将原始文档的全文作为证据,并引入了两个丰富的数据集。实验证明,即使没有标注黄金证据句子,包括原始文档在内的证据可以提供足够的上下文线索,该系统能够在不同的设置下显著提高最佳报告模型的精度。
- ACL模型分析与评估:歧义问题回答
研究 Question Answering 模型回答模糊问题的挑战,探讨模型 / 数据扩展和自动评估指标对模型质量的影响,并研究模型答案的证据根据,旨在提供有关当前方法局限性的宝贵见解。
- 信念、知识和证据
本文介绍了一种新的逻辑系统,它将经典认知领域中的相信和知识概念与一个概念证据相结合,从而满足了直觉原则 ` 证据导致相信和知识 ';该文的方法则是将这个新系统与内部真实性的 $S5$ 风格原理相结合,产生了一个模态系统 S5 和预示依存性的 - 联合加权平均 (JWA) 算子
本研究提出了一种结合了两种信息聚合方法的加权平均算子,利用组合几何将信息来源和证据的先验价值整合起来,从而产生无法通过传统算子实现的结果,并探讨了该算子在机器学习和心理学等不同领域的潜在应用。
- Grow-and-Clip: 答案解释的简明信息蒸馏方法
本研究提出了 Grow-and-Clip 证据提取算法,通过权衡证据的信息量、简洁性和可读性,从语境中提取证据以增强问答模型的可解释性,并在 SQuAD 和 TriviaQA 数据集上进行了实验证明,证据的自动提取具有与人类相似的信息量、简 - CVPR基于内容和多模态的开放领域图片事实核查在线资源
该研究提出了一种基于多模态证据的检查方法,通过对图像和标题进行事实检查,有效应对了当前社交网络中易传播的虚假信息。同时,引入了一种名为 'Consistency-Checking Network' 的新型架构,模拟了人类跨模态推理的过程。
- AAAI人机协同感知共享模型
本文提供了一种基于证据和科学方法的通用模型,能够帮助智能分析师和基于知识的代理之间的协作,通过生成解释性假设、发现相关证据,及基于模型测试假设,从而使代理能够理解和应对各种情况,例如包括可能涉及生产武器的情况,以及从该领域获得的其他相关情况 - EMNLP利用上下文感知线性化进行图形推理,实现可解释的事实提取和验证
本文提出了一个端到端的事实提取和验证系统,使用文本和表格证据,探讨了多任务学习图注意力网络同时训练证据提取和真实性预测任务,单独学习真实性预测和分离式证据提取的操作,并通过表格线性化模板捕捉表格数据的上下文和内容。最佳模型在盲测试数据中获得 - ACLCOVID-Fact: COVID-19 疫情相关真实声明的事实提取和验证
我们介绍了一个名为 COVID-Fact 的 FEVER 风格数据集,它包含 4086 条有关 COVID-19 大流行的索赔信息,我们利用自动方法检测真实索赔和它们的来源文章,并使用自动方法生成反驳索赔,有助于检测 COVID-19 的一 - 基于证据的事实错误校正
本文介绍了事实错误校正的任务和方法:通过编辑要求以便生成的改写通过证据更好地支持。使用 T5 Transformer 基于远程监督的方法,通过将证据合并到掩码声明中来训练事实错误校正系统。在一个基于最近事实验证共享任务的数据集上进行评估,结 - ACL自动辨别假新闻:模型是否学会了推理?
本文探讨了事实检查模型的推理方式以及声明和证据的关系,并发现在政治事实检查数据集上,仅使用证据比同时使用声明和证据的效果更好。这凸显了现有的自动虚假新闻检测方法中构成证据的重要问题。
- ACL基于证据的事实错误修正
本文介绍了一个新的任务:事实错误纠正。通过将证据整合到掩码声明中进行更正,学习纠正事实错误的系统。本文中提出了一个基于 T5 变压器的两阶段远程监督方法,通过检索证据获得更好的结果,从而取得了更好的性能,并通过人类评估证明了其有效性。
- ACL向量量化变分自编码器结合证据感知推理文本生成
研究使用自然语言处理技术,提出了一个基于编码器 - 解码器和自动查找语料库中事件证据的半监督方法,提高了生成事件推理性文本的性能。该方法在 Event2Mind 和 ATOMIC 数据集上达到了最先进的水平。
- EMNLP验证科学主张:事实或虚构
科学的论断验证是一个新的任务,其目的是从研究文献中选择包含支持或驳斥给定科学论断的摘要,并确定证据。为了研究这个任务,我们构建了 SciFact 数据集,其中包括 1.4K 个专家撰写的科学论断,以及用标签和论据注释的含有证据的摘要。我们开