Feb, 2023

面向多领域和多任务对话的少样本结构化策略学习

TL;DR本研究旨在探讨使用结构化政策提高在多领域和多任务环境下的强化学习样本效率。作者在测试不同结构化水平时,发现图形神经网络具有优势,且建议未来的研究应聚焦于连接人类数据、模拟器和自动评估器。