Sep, 2023

神经符号元强化先行学习在非静态环境中实现安全的自动驾驶

TL;DR该研究介绍了一种基于神经符号元强化前瞻学习(NUMERLA)的在线元强化学习算法,采用前瞻更新机制实现了自动驾驶模型在非稳态城市人车交互场景下的实时适应性和安全性。