BriefGPT.xyz
大模型
Ask
alpha
关键词
subtask graph
搜索结果 - 2
针对少样本任务概括的快速推理和组合任务结构转移
本研究提出基于多任务子任务图推断的少样本强化学习方法,通过推断训练任务的高层子任务图结构,提高在测试任务中的任务推断和适应能力,实验结果表明其能够学习并利用任务的潜在共同结构,比其他现有算法如元强化学习、分层强化学习和启发式智能体等更快地适
→
PDF
2 years ago
分层强化学习用于具有子任务依赖性的零样本普适性
提出了一种新的强化学习问题,该问题需要代理在一个由子任务图描述的先前未见的环境中进行泛化,我们提出了一种神经子任务图求解器,通过使用递归神经网络嵌入来编码子任务图,并用基于梯度的策略,图奖励传播来预训练它,进一步通过演员 - 评论家方法微调
→
PDF
6 years ago
Prev
Next