嗨，AI，你能通过与代理人对话解决复杂任务吗？

ACLOct, 2021

嗨，AI，你能通过与代理人对话解决复杂任务吗？

Hey AI, Can You Solve Complex Tasks by Talking to Agents?

Tushar Khot, Kyle Richardson, Daniel Khashabi, Ashish Sabharwal

TL;DR为了解决模型训练的数据和资源浪费问题，本文提出了一项新的挑战 —— 通过自然语言与现有智能体通信以完成复杂任务。通过设计一个综合性的基准测试 ——CommaQA，该基准测试包括三项复杂的推理任务，旨在通过与现有的 QA 智能体进行沟通来解决这些任务。研究表明，传统的黑盒模型在使用现有智能体的知识和金标事实监督时也难以从头开始实现此任务。相比之下，学会与代理通信的模型表现更好，即使没有任何辅助监督和数据，这种通过与现有代理完成复杂任务的学习仍然是非常困难的。本文提供了 CommaQA 基准测试和组合泛化测试集，以推动这方面的研究。

Abstract

Training giant models from scratch for each complex task is resource- and data-inefficient. To help develop models that can leverage existing systems, we propose a new challenge: Learning to solve complex tasks by communicating with existing agents (or models) in natural language. We design a synthetic benchmark, CommaQA, with three →

model training natural language communication commaqa benchmark complex reasoning tasks auxiliary supervision

发现论文，激发创造

复杂的连续问答：学习在知识图谱上对话问答对

本文提出了一个任务，即 Complex Sequential QA，它结合了回答简单事实性问题和通过一系列有逻辑的问答匹配进行会话来进行复杂推理，本文也介绍了关于这个任务所需数据集，以及目前现有的模型在处理实际场景中还存在的不足。

Jan, 2018

迈向 AI 完全问答：一组前置 Toy 任务

通过提出一组考核阅读理解水平的代理任务，我们测量了自然语言处理中的方法应用于推理和建立智能对话代理的长期目标，提出的任务可以通过链式事实、简单归纳、演绎等多种方式测试系统的理解能力，并为希望能够与人类对话的任何系统奠定必要的先决条件，我们相信，许多现有的学习系统目前还无法解决这些问题，我们的目标是将这些任务分类为技能集，以便研究人员可以确定并纠正他们的系统的缺陷。我们还扩展和改进了最近介绍的 Memory Networks 模型，并表明它能够解决其中的一些任务，但不是全部。

Feb, 2015

分析一个主动问答机器人所学习到的语言

该文章分析了一个被训练使用强化学习的代理程序学到的语言，作为 ActiveQA 系统的组成部分。在这个系统中，问题回答被框架化为一项强化学习任务，代理学习重构用户问题以引出最佳答案。研究发现，代理程序并没有学习与语义相关的转换，而是通过学习传统的信息检索技术（如 tf-idf 重新加权和词干化）来适应回答系统的语言。

Jan, 2018

问答式交互语言学习

该论文提出了一种基于交互的文本问答任务 QAit，通过使用基于深度强化学习的智能体与部分可观察的文本环境交互来获取答案所需的信息，提高了机器阅读系统在问答任务中的表现。

Aug, 2019

向协作问答迈进：初步研究

提出了一种新的具有复杂度的问题，并由多个专家代理协调工作，利用知识图谱和神经网络来解决问题，并说明了解决复杂问题协作结构的先前和后续扩展的必要性。

Jan, 2022

评估学习端到端对话系统的先决条件素质

本文提出了基于电影领域的一套新任务套件，旨在测试模型回答事实性问题、提供个性化、进行短对话及在 Reddit 上执行自然对话的能力，评估了各种模型在这些任务上的性能表现。

Nov, 2015

互动文本游戏的知识增强代理

该文提出了一种通过注入领域知识的方式来改善基于文本游戏中的智能代理的实现过程，并考虑了多种不同的注入策略，包括知识图谱和输入编码策略的增强，实验结果在 ScienceWorld 文本游戏环境中得到证明。

May, 2023

语言模型能解决计算机任务

本研究展示了一种使用 RCI 方法来自然语言执行计算机任务的代理方法，此方法能够显著提高计算机任务的自动化表现，优于现有的自然语言处理方法，并在自然语言推理任务中表现出较好的推理能力。

Mar, 2023

MetaQA：专家代理人联合多技能问答

本研究提出了一种灵活和高效的架构，旨在通过考虑问题、回答预测和置信度得分来从候选答案中选出最佳答案，将专家代理与该架构相结合，从而在多域和多数据集方案中实现了先前的多代理和多数据集方法所不能达到的表现。

Dec, 2021

TaskMatrix.AI：通过连接基础模型和数百万个 API 完成任务

本篇论文提出了一种新型的人工智能生态系统，将基础模型与数百万 API 相连通以实现各种数字和实体任务，该方法主要利用基础模型作为中心系统，将这些 API 作为子任务解决器，以完成各种任务。

Mar, 2023