Feb, 2022

走向新RL网络;目的性图的出现

TL;DR利用neoRL框架的认知地图和一般值函数实现潜在学习来提取人工智能的目的行为,而自主性的欲望节点允许更深层的neoRL行为图。通过实验验证了四个旨在实现目的网络的原则,证明了受neoRL网络的自主欲望控制的代理能够实时学习并在欧几里得空间中导航,表明现代AI仍然可以从早期的心理学启发中获益。