Jan, 2022

使用自动悬挂网系统学习泛化的碎片捕捉鲁棒策略

TL;DR在本文中,我们介绍了一种基于强化学习和近端策略优化的方法来改进利用碎片网捕捉和处理太空垃圾的可行性。我们提出的策略不仅能在不同的场景下捕获垃圾,而且在许多方面都比基于可靠性的优化要好。