BriefGPT.xyz
Ask
alpha
关键词
arrival time
搜索结果 - 1
零 - shot 泛化的机器人运动规划的联邦强化学习
本文提出了一个零样本泛化的机器人运动规划学习控制策略的问题,在新环境中部署学习策略时不需要数据收集和策略调整;开发了一个联邦强化学习框架,可以实现多个学习者和中央服务器(云)协作学习,而无需共享原始数据;在每次迭代中,每个学习者上传本地控制
→
PDF
4 months ago
Prev
Next