Dec, 2023

强化学习中的迁移基础:知识模式分类

TL;DR当代人工智能系统的不断发展需要相应的资源、大量数据集和计算基础设施,特别是在限制环境下的基础研究和应用中,知识的表示通过各种模态呈现,包括动力学和奖励模型、价值函数、策略和原始数据。该论文系统地讨论了这些模态,并基于其固有属性和与不同目标和机制之间的相互关系来进行讨论,以实现知识的迁移和推广,并分析了特定形式的转移出现或稀缺的原因,并强调从设计到学习的转移的重要性。