- 大语言模型中政治劝导的对数标度定律的证据
使用多种规模的大型语言模型生成的政治信息,证明规模越大并不意味着越具有说服力,实验结果显示完成任务(连贯性,专题一致性)是较大模型说服力优势的主要原因。
- Mobile-Agent-v2: 移动设备操作助手通过多智能体协作实现有效导航
通过多代理体系架构,Mobile-Agent-v2 为移动设备操作任务提供了较好的导航能力,相比于单代理架构的 Mobile-Agent,在任务完成方面取得了 30% 以上的改进。
- 任务和解释网络
深度网络的可解释性在近年来日益重要,我们认为,人工智能不仅需要完成任务,还需要解释为何以如此方式完成任务。我们提出了一个基本框架 —— 任务和解释网络(TENet)—— 完全整合了任务完成和其解释。我们相信整个人工智能领域应该强调可解释性。
- 双重文本图像指示下的多模式程序规划
研究了利用图文混合信息来辅助人类完成任务的方法,提出了基于多模态程序规划的任务,使用基于大型语言模型的有提示和图片描述提示的方法可以生成具有信息性和准确性的图文混合任务规划。
- TaskMatrix.AI:通过连接基础模型和数百万个 API 完成任务
本篇论文提出了一种新型的人工智能生态系统,将基础模型与数百万 API 相连通以实现各种数字和实体任务,该方法主要利用基础模型作为中心系统,将这些 API 作为子任务解决器,以完成各种任务。
- 语言引导的具身化智能体多模式语音识别
本文提出了一种多模式自动语音识别模型,通过考虑附带的视觉上下文来减少口头指令的错误转录,使用了仿真的噪声环境。实验结果表明,使用多模态 ASR 模型可使任务完成的准确性得到提高。
- 生成概率不足以满足需求:探索不确定性突出在 AI 支持的代码自动补全中的有效性
揭示不确定性信息对于程序员使用基于 AI 的代码补全工具更快,更准确的生成功能很有用,高互动性的设计空间更进一步地要求高亮的波动粒度要细,信息要可解释,不压倒性。
- 任务驱动的具身化智能代理的对话行为
研究中提出通过模型建立对话和为任务完成注释一组对话行为,并利用这些注释数据为对话行为建模训练模型,从而改善智能体对话行为和低级动作执行的任务完成。
- ACL使用语言模型进行小样本子目标规划
本文探讨了预训练的大型语言模型在预测现实世界环境中可行的计划方面的能力,表明预先训练的语言模型中的语言优先级允许我们推断出细粒度的子目标序列,并提出了一种通过环境的交互和反馈重新排列语言模型预测的简单策略,结合预先训练的导航和视觉推理组件在 - ACL基于任务导向的对话系统高质量多样化策略
本文提出了一种用于任务型对话系统的对话多样化方法,该方法有效地控制了多样化的质量,并且与多个用户模型的交互有助于增强深度强化学习代理的能力,从而提高了对话代理的性能。
- ACLSOLOIST: 基于迁移学习和机器教学的大规模任务机器人构建
SOLOIST 是一种利用迁移学习和机器教学构建任务机器人的新方法。我们使用基于 Transformer 的自回归语言模型对经典的模块化面向任务的对话系统进行参数化,可以通过机器教学将预训练模型高效地适应完成新任务。该预训练模型在 CamR - 对话管理综述:最新进展与挑战
本文综述了对话管理的三个关键主题:模型可扩展性的提高、对话策略学习的数据稀缺问题和训练效率的提高,以及它们对任务完成性能的影响。
- 种子迭代学习抵制语言漂移
本文提出了一种通用的方法来对抗所谓的语言漂移现象,这种方法叫做 Seeded iterated learning (SIL),该方法通过周期性地对预训练的学生智能体进行附着,以模仿从新生成的老师智能体采样的数据,并评估了该方法的效果。
- 利用地图熟悉、课程学习和赌徒反馈学习基于文本冒险游戏的系列
本研究探讨了如何应用深度强化学习策略来让计算机代理学会玩一类由文本组成的冒险游戏,并使用基于人类学习行为的简单策略如课程学习、导航探索和多臂赌博来提高游戏的任务完成率。
- Microsoft 对话挑战赛:构建端到端任务完成对话系统
本论文提出了一种对话挑战,用于构建端到端的任务完成对话系统,目标是鼓励对话研究社区在标准数据集和统一实验环境上合作和基准测试。在这个特殊的会话中,我们将发布在三个领域(电影票预订,餐厅预订和出租车预订)中的人工注释的对话数据,以及每个领域内 - 假设行为中的信仰和真相
研究了在多代理系统中如何利用贝叶斯学习来控制单一代理,从而完成任务并最大化收益,包括如何将证据纳入概率信念中,如何影响长期利润的先验信念以及如何检验推断类型的正确性。