BriefGPT.xyz
大模型
Ask
alpha
关键词
hidden state curiosity
搜索结果 - 1
基于自由能原理的在观测噪声下无害探索的内在回报的模拟研究
在强化学习中,人工智能代理通过执行任务来最大化数值奖励,探索是至关重要的,因为代理必须在利用之前发现信息。熵和好奇心是促进有效探索的两种奖励方式。这篇论文基于自由能原理(FEP)提出了隐藏状态好奇心,并发现熵和好奇心可以实现高效探索,特别是
→
PDF
2 months ago
Prev
Next