May, 2024

非局部非追溯性主动搜索的摊销深度模拟学习

TL;DR通过训练神经网络学习搜索的策略,我们研究了在稀缺、有价值类别中进行主动搜索的问题,并使用模仿学习技术模拟专家的策略,实现了具有竞争性性能的低成本搜索策略。