Apr, 2022

一种基于端到端交互的模块化体验智能体的多集 - 学习方法

TL;DR本文介绍了一个基于身体型机器学习的代理系统,通过与人群工作者互动,改进自身。我们通过多次自动化的人 - 代理交互,学分分配,数据注释,重训练和重新部署模型来证明代理改进。