Jun, 2023

PAC 强化学习的主动覆盖

TL;DR本研究提出了一个灵活的框架来解决强化学习过程中数据覆盖率问题,并通过 CovGame 算法来匹配最低采样复杂度,进而解决了不同的演示性增强学习任务问题。