Apr, 2024

具保证的行为模型学习

TL;DR通过搜索假设,本研究基于版本空间发展了一种行动模型学习理论,解释了具有完全可观察性的行动模型学习问题,并通过在线算法实例化了该理论,证明了给定足够的示例,确定性和非确定性模型都会收敛于相同的真实模型,并证明了它们在一系列计划领域的实用性。