- Golovin AI代理的基于文本的冒险
本篇论文主要介绍了我们的方法来解决文本冒险游戏中需要理解自然语言并在游戏中表现出智能行为的代理问题。我们的代理Golovin利用游戏领域的限制,利用相关文献和游戏来创建适用于该领域的语言模型。此外,我们还嵌入了机制,以便我们可以指定和分别处 - Iris:用于处理复杂任务的对话代理
本文介绍了 Iris,一个利用人类交谈策略将命令组合起来以执行更复杂任务的代理系统,并且引入了一种领域特定的语言,用于将命令转化为 Iris 可以动态地组合、排序和执行的自动机,在评估中,我们发现数据科学家使用 Iris 完成预测建模任务的 - 面向谁的可解释性?一种基于角色的模型,用于分析可解释的机器学习系统
通过建立代理角色模型,为解决机器学习系统可解释性问题提供一种新思路,并探讨代理角色对可解释性定义和机器学习目标的影响,为解释性研究、系统开发和监管机构的审计提供了一些启示。
- 基于视觉对话的社区规范化
本文提出并评估了一种基于多智能体社区的对话框架,在不牺牲任务性能的情况下,通过社区强制规范产生更相关和连贯的对话。
- 利己还是利他?使用强化学习的不同行为特征代理在合同谈判中的行为
使用多智能体强化学习训练的深度学习代理协商合同协议,建立自私和互惠行为的多样性模型,提供经验证据证明,代理人行为一致,最终训练一个元代理,通过学习混合的行为模型,以确保代理人的实用性,并通过实验验证,发现代理人在谈判中出类拔萃并能够合理模拟 - 根据书本玩游戏:从文本中提取动作网络的交互式游戏方法
提出一种新的方法 Text2Quest,将过程文本解释为交互式游戏的说明,以从材料科学论文中提取动作图形。该方法可以补充现有方法,并实现比静态文本更丰富的学习形式。
- 塑造叙事弧线:一种信息论方法的协作对话
设计一种人工智能代理,能够与人类进行协作对话,创作有趣的故事;该模型可以增强任何基于概率方法的对话代理,使其能够思考已建立的宇宙信息和潜在的下一句话可能揭示的内容。研究表明,此模型允许控制代理透露信息的速率,从而显著提高了预测电影对话下一行 - NAIL: 一个通用的交互小说代理
介绍 NAIL,一种适用于 general parser-based interactive fiction 游戏的自主代理,通过2018年 Text Adventure AI 竞赛取得胜利,文章描述了其架构、开发和性能。
- Arena:多智能体智能评估平台和构建工具包
介绍了一个名为 Arena 的多智能体通用评估平台,其中包含35个逻辑和表述多样的游戏,以及可视化的社会树和五种基本的多智能体奖励机制,为研究人员提供了一个易于发明和构建新的多智能体问题的建模工具包,还提供了五个最先进的深度多智能体强化学习 - 从自然语言指令和GUI演示中进行交互式任务与概念学习
本篇论文介绍了一种新的多模态、领域无关的方法,结合自然语言编程和演示编程,允许用户在高层次上自然描述任务和相关条件,并通过对话和演示递归地解决任何模糊不清的问题。PUMICE是一个可供最终用户编程的代理系统,实现了这种方法。10位用户的实验 - 帮助,安娜!通过回溯性好奇心鼓励模仿学习进行自然多模态辅助的视觉导航
本研究开发了一个交互式真实仿真平台“Help, Anna!”(HANNA),其中一个代理可通过请求和解释自然语言和视觉援助来完成物体寻找任务,解决HANNA问题,我们开发了一种记忆增强的神经代理和一种以模仿学习为基础的算法,通过有效地询问帮 - 从我的伙伴行动中学习:去中心化机器人团队中的角色
该研究提出了一种新的方法,通过为每个机器人定义不同的角色来实现团队协作,从而代替直接通信,使机器人同伴正确理解彼此行动的含义,研究结果表明,利用不同角色的协作效果与显式交流不相上下.
- 通过查询回答学习可解释的动作模型的正确方法
本文提出了一种新的方法,使用最少的查询界面,采用分层查询算法来生成询问策略,以估算黑盒自主智能体的可解释性实体模型,并使用谓词分类器学习代表状态的图像的规划智能体的可解释模型。经验证明,尽管可能存在无法搜索的潜在空间,但我们的方法允许对各种 - 太多厨师: 用贝叶斯推理协调多智能体合作
本文提出了一种基于 Bayesian Delegation 的分散式多智能体学习机制,通过逆向规划实现智能体对他人潜在意图的快速推断,实现协调和合作,展示在多智能体马尔可夫决策过程中的成功应用。
- 开放域对话代理:当前进展、未解决的问题和未来方向
该论文讨论了构建一个引人入胜的开放领域对话代理所必需的特质,研究成果以及未来的发展空间。特别是,讨论了不断学习、提供引人入胜的内容和良好行为的特性,以及如何衡量其成功。最后总结了作者的经验和建议。
- 实时人-智能体协同的自适应智能体架构
提出一种基于预训练的RL策略库和规则策略的人类无模型自适应代理架构,通过一种新的相似性度量方法推断人类策略并选择最具互补性的策略,以此最大化团队在人类机器协作中的总体表现。
- 盲目阅读和行动:文本游戏代理需要语义学
以基于文本的游戏为测试平台,研究了自然语言理解代理的语义理解能力;实验结果表明,在降低语义信息量的情况下,自主代理仍能够在游戏中取得高分,提出了逆动力学解码器来增强语义理解的性能。
- 具有可扩展问答代理分类器的Transformer(TWEAC)
提出了一种元问答系统来有效地识别合适的多个专用问答代理以回答各种问题,通过研究监督和非监督方法的应用,证明了TWEAC是最佳选择,能够以94%的准确率进行答案预测,而且在扩展性方面表现出色。
- 智能体能力光谱基准测试
文章介绍了一种名为Crafter的开放世界生存游戏,可评估智能代理的广泛能力,并通过提供的奖励信号或内在目标进行学习和评估,以使代理成功解锁所有成就需要强大的泛化、深入探索和长期推理。
- Transform2Act: 学习变换和控制策略以实现高效的智能体设计
我们提出了一种名为Transform2Act的方法,该方法通过学习条件策略将智能体的设计程序纳入其决策过程中,在设计结构和控制方面进行联合优化,使用基于图形的策略来处理不同节点的关节,取得了快速收敛和最终表现的显著提高,并且还可以自动发现类