Dec, 2023

LExCI: 嵌入式系统的强化学习框架

TL;DR在控制工程的背景下,人工智能的发展使得其应用于日常生活的许多领域。在强化学习中,RL(reinforcement learning)是一种特别有前景的方法,其核心思想是允许代理与环境自由交互以找到最佳策略。然而,传统的 RL 库很难与嵌入式硬件结合使用。本文介绍了一种名为 LExCI(Learning and Experiencing Cycle Interface)的框架,它弥合了这一差距,并为终端用户提供了一个在嵌入式系统上使用开源库 RLlib 训练代理的免费工具。通过两种最先进的 RL 算法和一种快速控制原型系统来证明其可操作性。