Jun, 2023

BackpropTools:一款快速便捷的深度强化学习库,用于连续控制

TL;DRBackpropTools 是一个用于深度监督和强化学习的 C++ 库,能够在各种平台上高效地工作,其 RL 算法与模拟环境的紧密集成使得在微控制器上直接训练深度 RL 算法成为可能,这使得 “微型强化学习 (TinyRL)” 领域初次呈现。