该文提出了一种通过注入领域知识的方式来改善基于文本游戏中的智能代理的实现过程,并考虑了多种不同的注入策略,包括知识图谱和输入编码策略的增强,实验结果在 ScienceWorld 文本游戏环境中得到证明。
May, 2023
本文探讨了基于文本的游戏控制策略的学习方法。该方法使用深度强化学习框架,联合学习游戏状态表示和行动策略。通过把文本转化为向量,能够更好地捕捉游戏状态的语义表示。实验结果表明,我们提出的方法显著优于传统基于词袋模型的方法。
Jun, 2015
本文研究了利用自然语言来推动控制策略的泛化,并引入了一个新的多任务环境 Messenger,其中包括自由形式的文本手册,描述环境动态。使用实体 - 条件的注意力模块,作者提出了一个新的模型 EMMA,它可以从文本到观察值学习实体和动态之间的潜在关系,并实现了成功的零样本泛化。
Jan, 2021
本论文提出了一种利用大型语言模型进行机器人交互的方法,用于解决理解语义知识和实现机器人任务之间的矛盾问题,其中引入了基于概率过滤的策略来采用语言模型和基于物理环境的模型两者的优势,通过指导解码策略可以实现复杂的机器人长视程任务。
Mar, 2023
本研究探讨了深度强化学习在文本游戏中的应用,提出了通过引入知觉模块以及使用两阶段训练框架来提高样本效率,从而解决了应用 DRL 的两个主要挑战。实验结果表明,提出的方法显着提高了性能和样本效率,并且对复合错误和数据有限的预训练表现出鲁棒性。
Mar, 2022
本文介绍了一种利用自然语言驱动强化学习传递的方法,并使用模型化强化学习方法和实体描述等技术,在不同环境下实现了更好的性能表现。
Aug, 2017
通过使用端到端学习的图形结构表示,我们提出一种新颖的图形辅助转换器代理(GATA),并探究其如何计划和推广文本游戏,并证明学习到的基于图形的表示有助于代理人收敛到比纯文本模型更好的策略,促进游戏配置的有效推广。
Feb, 2020
本文提出了一种交互式的任务规范问题形式,通过自然语言指令和一系列语言修正来引导自主代理获得新技能,实现快速获取新技能,显著优于直接非交互式指令跟随。
Nov, 2018
通过自动生成规则和提高适应性,AutoManual 框架使基于大型语言模型(LLM)的代理能够自主构建自身的理解并适应新的环境。在 ALFWorld 基准任务上,通过 GPT-4-turbo 和 GPT-3.5-turbo,AutoManual 显著提高了任务成功率,并生成了人可读的综合手册。
May, 2024
本研究提出了一种具有突破性的文本命令控制系统,用于能够理解以自由形式表达的自然语言命令的游戏代理,通过使用大型语言模型(LLM)进行代码生成以将自然语言命令解释和转换为基于行为树的行为分支的知识表示,从而促进游戏代理的执行。经过模拟宝可梦游戏的游戏环境中进行的实证验证和多参与者的参与,结果确认该系统具备理解和执行自然语言命令的能力,代表了实时语言交互式游戏代理领域的引人注目进展。
Feb, 2024