使用虚拟对手模型进行决策

Nov, 2022

Decision-making with Imaginary Opponent Models

Jing Sun, Shuo chen, Cong Zhang, Jie Zhang

TL;DR提出了一种基于分布式 Actor-Critic 算法的多智能体虚拟对手建模方法，通过构建虚拟模型来模拟未观察到对手的行为，使用本地可得信息实现虚拟对手模型的训练和优化。实验证明该方法能有效准确地模拟对手行为，相较于基线方法具有更快的收敛速度并显著提升了性能表现。

Abstract

opponent modeling has benefited a controlled agent's decision-making by constructing models of other agents. Existing methods commonly assume access to opponents' observations and actions, which is infeasible when opponents' behaviors are unobservable or hard to obtain. We propose a no

opponent modeling multi-agent imaginary opponent models local information distributional actor-critic algorithm

发现论文，激发创造

深度强化学习中的对手建模

本文介绍了一种基于神经网络和任务多项式结构的对手建模方法，该方法能够应用于多智能体环境下的策略自适应，通过对足球和智力竞赛等游戏的模拟实验可知该方法胜于深度 Q 网络及其衍生方法。

Sep, 2016

基于模型的对手建模

本文提出基于模型的对手建模（MBOM）方法，通过模拟环境模型中的递归推理过程和混合想象对手策略来适应各种类型的对手，在固定策略、初学者和推理者等多重对手场景中，MBOM 的适应性比现有方法更优。

Aug, 2021

多智能体系统中对手建模的变分自编码器

本研究使用变分自编码器对多智能体系统中特定行为进行对手建模，以及提出了一种使用局部信息来识别对手模型的方法，结果表明我们的对手建模方法在强化学习任务中取得了相当好的结果。

Jan, 2020

多人不完美信息博弈中的贝叶斯对手建模

本研究探讨了面对多个对手的策略交互游戏，使用对手建模和观察对手策略等技术，超越纯理性策略的表现。

Dec, 2022

通过对抗性集成强化学习在非对称不完美信息游戏中实现强大的对手建模

本文提出了一种算法框架，用于在不完美信息的非对称博弈中学习鲁棒策略，并通过对手建模来推断对手类型，使用多智能体强化学习技术通过自我博弈学习对手模型，并使用集成训练方法来提高策略的稳健性，借助随机优化方案动态更新对手整体来平衡稳健性和计算复杂性。

Sep, 2019

对手学习建模的学习

提出了一种名为 LeMOL 的对手学习动态建模方法，该方法用于结构化对手建模，以通过学习对手的适应和学习行为来降低策略搜索算法中的方差，从而提高多代理系统中算法代理的性能。

Jun, 2020

对手建模中的双重深度 Q 学习

本研究使用 DDQN 和优先经验重放机制模拟主代理和二级代理的策略，并通过对手建模架构识别不同的对手策略模式，最终在两个环境下分析了我们的模型，研究结果表明基于对手建模的 Mixture-of-Experts 模型表现优于 DDQN。

Nov, 2022

通过关联数据适应进行谈判对话中的对手建模

本研究提出了一种 for identifying the priorities of the opponent in multi-issue negotiation from partial dialogues，通过关键词识别和数据适应的方法，对话模型在零散输入数据的情况下，能准确预测对手的所重视的议题顺序。

Apr, 2022

基于对比学习的深度强化学习中的代理建模

多代理系统中，对智能机器代理进行适应性策略设计时，代理建模是至关重要的，通过代理建模可以理解其他代理的行为并提取有意义的策略表示，为增强自我代理的适应性策略提供帮助。这篇研究以对比学习为基础的代理建模方法（CLAM）只依赖于自我代理在训练和执行过程中的局部观察，可以实时生成一致且高质量的策略表示，且在合作和竞争多代理环境中取得了最先进的结果，突显了对比学习为基础的代理建模在增强式学习中的潜力。

Dec, 2023

对手模型区分度的游戏生成

保护不受敌对攻击是一个常见的多智能体问题，本研究使用心理学家收集的数据，建立了一个新颖的模型，通过优化参数化游戏，能够创建表现明显不同的游戏，这对于自动生成游戏以及发现模型不一致的情况辅助有所帮助。

Nov, 2023