Feb, 2023

K-SHAP: 基于策略聚类的匿名状态 - 动作对算法

TL;DR本文提出一种名为 K-SHAP 的策略聚类算法,可从匿名的环境状态 - 动作对中学习代理策略,涉及观测数据、多智能体系统、金融市场等多个领域。