Jun, 2022

强化学习的大规模检索

TL;DR本文探讨了一种不同于深度强化学习的方法,通过利用大规模上下文情境的数据库搜索来支持参数计算,实现直接学习以利用相关信息指导输出,并且用此方法提高了离线与在线强化学习智能体的表现