单轮辩论不能帮助人类回答困难阅读理解问题

Apr, 2022

单轮辩论不能帮助人类回答困难阅读理解问题

Single-Turn Debate Does Not Help Humans Answer Hard Reading-Comprehension Questions

Alicia Parrish, Harsh Trivedi, Ethan Perez, Angelica Chen, Nikita Nangia...

TL;DR针对当前QA系统无法提供合理的解释或证据而生成错误答案的问题，我们提出了一个辩论式的数据集，用于训练模型为两个候选答案提供解释。然而，我们未发现该设置中的解释能够提高人类准确性，但提供人类选择的文本片段则可提高准确度，我们使用这些结论建议未来数据收集工作的改进。

Abstract

Current qa systems can generate reasonable-sounding yet false answers without explanation or evidence for the generated answer, which is especially problematic when humans cannot readily check the model's answers. This presents a challenge for building trust in →

发现论文，激发创造

通过辩论实现人工智能安全

通过采用自我对弈的零和辩论游戏的方式来训练智能体，以此作为人类判断的替代，来实现AI系统对于复杂任务的精准输出，并讨论了辩论模型的理论和实践方面的问题。

May, 2018

通过学习说服问答模型来寻找可推广的证据

使用基于句子的问题回答(QA)作为实验场景，我们提出了一种系统，该系统能够找到最强有力的支持证据以证明问题的答案，我们训练证据代理程序，以选择能够最具有说服力地证明给定答案的句子，这些证据不包括完整段落，我们发现，证据代理程序选择一般化的证据，这种方法提高了QA在健壮性方面的表现，证据代理程序选择的证据使人类能够在只利用大约20％的完整段落的情况下回答问题，并且QA模型能够适用于更长的段落和更难的问题。

Sep, 2019

人工智能辩论中真相何时受青睐？

研究人员提出在AI解决方案无法得到准确判断的问题中，可通过两个AI系统之间的辩论来增强人类法官的问题解决能力，并介绍了一个可建模此类辩论的数学框架，并将辩论设计的质量测量为最有力回答的准确性。

Nov, 2019

Grow-and-Clip: 答案解释的简明信息蒸馏方法

本研究提出了Grow-and-Clip证据提取算法，通过权衡证据的信息量、简洁性和可读性，从语境中提取证据以增强问答模型的可解释性，并在SQuAD和TriviaQA数据集上进行了实验证明，证据的自动提取具有与人类相似的信息量、简洁性和可读性。

Jan, 2022

教授语言模型通过验证的引文支持答案

通过强化学习从人类偏好中得出支持性证据，训练生成回答并支持其声称的“开放式书目”QA模型。该模型能够从搜索引擎中找到的多个文档或单个用户提供的文档中提取支持证据。通过在NaturalQuestions和ELI5数据集的子集中进行的人类评估，该模型的响应在这两个子集中80％和67％的时间内达到高质量水平，但并非所有声称都被支持的证据是正确的。

Mar, 2022

两轮辩论无助于人类回答难度较高的阅读理解问题

本文研究采用竞争型答案选项辩论的形式帮助人类答题，并考察了增加反驳环节是否对人类有帮助。结果显示，在阅读理解问题的场景下，辩论并不是一种有效的帮助方式。

Oct, 2022

利用矛盾来改进问答系统

使用自然语言推理技术和矛盾验证策略来提高问题回答系统的准确性和可靠性在生物医学领域具有重要意义。研究表明使用矛盾验证模型可以在问答选择任务方面取得良好的表现，并且对于解释模型智能性和提高系统可靠性具有潜在意义。

Sep, 2022

辩论有助于监督不可靠的专家

辩论通过两个不可靠专家的辩论，帮助非专家更可靠地辨别真相，相较于仅由一个专家提供答案的顾问咨询方法在提高了效率的同时，能够显著提升评判的准确性，为监督日益强大但潜在不可靠的AI系统提供了有希望的方法。

Nov, 2023

与更具说服力的LLMs辩论会导致更真实的回答

大型语言模型的对齐方法主要依赖于人工标注数据，但随着模型的不断发展，人类专业知识将不再足够，将由非专家来监督专家。我们研究了一个类似情景，强大模型（专家）拥有回答问题所需的信息，而弱小模型（非专家）缺乏这些信息。我们发现辩论方法对非专家模型和人类都有帮助，相应的准确率分别为76%和88%（与朴素基准分别为48%和60%）。此外，以无监督方式优化专业辩手的说服力可以提高非专家模型在辩论中识别真相的能力。我们的研究结果为在没有绝对真实性的情况下，通过辩论来对齐模型提供了有益的实证证据。

Feb, 2024

通过自我对弈训练语言模型赢得辩论提升评估准确性

本研究旨在解决辩论作为可扩展监督方法的有效性问题，通过自我对弈训练模型进行辩论，使得语言模型评估者在长文本阅读理解任务中能更准确地回答问题。研究发现，与传统的说服性模型相比，基于辩论训练的模型能够生成更强有力和信息丰富的论点，显示出在难以直接评估的任务中提供高质量监督的潜力。

Sep, 2024