Dec, 2023

决策基础模型的自监督预训练:构建、流程和挑战

TL;DR决策是一个动态过程,需要感知、记忆和推理来做出选择和找到最佳策略。此研究论文主要介绍了将大规模自监督预训练所获得的知识整合到决策过程中的方法和挑战。