Dec, 2023

增强 Numeric-SAM 以用于少样本学习

TL;DRN-SAM*算法通过观察学习出所有行动至少在某些状态下可行,而不妨碍返回的行动模型的安全性,相较于N-SAM算法返回的行动模型,N-SAM*算法在解决问题方面取得显著的进展。