Jul, 2023

从零开始发现适应性符号算法

TL;DR提出了一种基于 AutoML-Zero 的方法 AutoRobotics-Zero(ARZ),该方法能够从零开始发现可以适应环境变化的策略。该方法采用线性寄存器机制来构建具有完整表达能力的控制算法,并在适应突发环境变化时即时调整模型参数和推理算法。在仿真的四足机器人上进行了实验,成功演化出了安全的控制策略,以避免在单个肢体意外折断时造成跌倒。与两种流行的神经网络基准相比,ARZ 方法表现出更大的鲁棒性,并能够构建简单且可解释的控制策略。