BriefGPT.xyz
Ask
alpha
关键词
bayesian policy
搜索结果 - 1
非局部非追溯性主动搜索的摊销深度模拟学习
通过训练神经网络学习搜索的策略,我们研究了在稀缺、有价值类别中进行主动搜索的问题,并使用模仿学习技术模拟专家的策略,实现了具有竞争性性能的低成本搜索策略。
PDF
a month ago
Prev
Next