BriefGPT.xyz
Ask
alpha
关键词
policy-gradient mechanism
搜索结果 - 1
我已做足了计划还是需要再进行规划?
该研究探讨人类在计算资源有限的情况下如何决策分配的元认知能力和元学习机制,结果表明人们通过学习来获得这种能力,并且可能是通过一种策略梯度机制来学习调整规划的数量。
PDF
3 years ago
Prev
Next