BriefGPT.xyz
大模型
Ask
alpha
关键词
construction heuristics
搜索结果 - 3
超越训练:通过自适应动作采样优化基于强化学习的工作车间调度
利用经过训练的深度强化学习智能体进行推理的优化参数化方法,该方法通过调整训练好的行为向量,使智能体在解决方案构建过程中更好地探索或开发,进而在有限的计算预算情况下生成更多可接受的解决方案。
PDF
23 days ago
残余调度:解决工作车间调度问题的新强化学习方法
本论文提出了一种名为 “残余调度” 的新方法,用于解决作业车间调度问题和灵活作业车间调度问题。实验证明,该方法在大多数著名的开放式作业车间调度问题和灵活作业车间调度问题基准测试中达到了最先进的水平。此外,研究还观察到,尽管该模型是针对较小规
→
PDF
9 months ago
AAAI
具有嵌入瞥见功能的多解码器注意力模型用于解决车辆路径问题
该研究提出了一种新的深度强化学习方法,用于学习车辆路径问题的构建启发式算法。实验结果表明,该方法显著优于现有的基于深度学习的模型。
PDF
4 years ago
Prev
Next