BriefGPT.xyz
Ask
alpha
关键词
valence function
搜索结果 - 1
不必奖励:如何创建一个组成性的自我保存代理以进行终身学习
本论文介绍了一个基于生理模型的特工,该特工使用 Self-Preserving Agent(SPA)结构,利用 Operator Bellman Equations(OBEs)编码面向目标的策略的非平稳和非马尔可夫任务,并使用固有动机功能来
→
PDF
2 years ago
Prev
Next