Aug, 2023

R^3:面向自主机器人的设备端实时深度强化学习

TL;DR本文介绍了 R^3,一种用于管理实时设备上 DRL 训练中的时间、内存和算法性能的整体解决方案。R^3 通过使用动态批处理大小和高效内存管理来优化时间,通过启发式分析和动态调整内存资源预留的运行时协调器,协同解决设备上 DRL 训练中的权衡问题,并实现了在不同平台上实时应用的一致延迟性能和时间可预测性。