BriefGPT.xyz
Ask
alpha
关键词
multi-agent problem
搜索结果 - 6
多拷贝强化学习代理
该论文研究了一种新型的多智能体问题,其中一个智能体通过复制自身来更好或更高效地完成单一智能体任务。我们提出了一种学习算法,用于解决多重复制问题,它利用价值函数的结构有效地学习如何平衡添加额外复制的优势和成本。
PDF
10 months ago
SEA:一种用于多智能体强化学习的空间显式架构
本文提出了一种空间信息提取结构,能够针对多智能体强化学习问题中智能体数量变化和规模巨大等问题,通过编码器 - 解码器结构有效地共享邻域和全局信息。该方法遵循中央训练和分散执行(CTDE)模式,并可以应用于各种现有的主流强化学习算法,在细微修
→
PDF
a year ago
王者荣耀竞技场:竞争性强化学习中的泛化环境
通过介绍荣耀王者竞技场这个基于荣耀王者的 RL 环境和提供与游戏引擎通信的 Python 接口,本文为 RL 方法在具有多种任务和对手的竞争领域中提供了初始基准结果,并展示了荣耀王者竞技场带来的泛化挑战以及可能的解决方法。
PDF
2 years ago
MANAS:多智能体神经架构搜索
本文提出了两种轻量级的神经架构搜索算法,并将 NAS 问题转化为多智能体问题以提高计算效率,理论上证明了 O (sqrt (T)) 的消失后悔率,实验结果在多个数据集和网络配置上表现优异,其中包括随机搜索。
PDF
5 years ago
深度强化学习在赞助搜索实时竞价中的应用
本文提出了一种基于强化学习的方法解决了在线广告拍卖中的实时竞标问题,特别是在搜索广告拍卖中针对多关键字的竞标策略提出了一个控制模型。
PDF
6 years ago
星际争霸 II:强化学习的新挑战
介绍了一种基于《星际争霸 II》游戏的增强学习环境 SC2LE,通过使用该环境,可以探索深度强化学习算法和架构。
PDF
7 years ago
Prev
Next