Jul, 2023

通过批处理学习实现双模态环境中强化学习智能体的稳定训练

TL;DR本文采用批处理更新的方式提出了一种新颖的学习方法,针对性地解决双峰随机环境下的强化学习问题,该方法对定价问题等现实应用具有显著的实用意义及工业部署潜力。