BriefGPT.xyz
大模型
Ask
alpha
关键词
stochastic beam search
搜索结果 - 3
神经组合优化的自我改进:无替换抽样,仅改善
通过结合行为克隆和增强学习方法,本文简化了端到端的神经组合优化训练过程,采用随机抽样解决方案并利用概率策略改进来提高模型性能,在旅行推销员问题和车辆路径问题方面取得了令人满意的结果,并应用于作业车间调度问题,超越现有的方法。
PDF
3 months ago
通过自我评估引导解码的分解增强推理
该研究提出了一种有效的提示方法,通过随机波束搜索融合自我评估指导,可以平衡生成链的质量 - 多样性权衡,并在少次学习的情况下,分别在 GSM8K、AQUA 和 StrategyQA 基准测试中比相应的 Codex-backboned 基线高
→
PDF
a year ago
ICML
随机束和它们的发现:Gumbel-Top-k 技巧在不重复采样序列中的应用
应用 Gumbel-Top-k 技巧和分解可重复采样,使用随机束搜索进行无重复抽样序列模型的研究,发现序列采样中存在随机束搜索和确定性束搜索之间的理论联系,这一方法在翻译任务中表现优异,且采样无重复序列可用于构造期望 BLEU 得分和模型熵
→
PDF
5 years ago
Prev
Next