BriefGPT.xyz
Ask
alpha
关键词
over-exploration
搜索结果 - 2
ScaLES:大规模潜在探索分数用于预训练生成网络
我们开发了可扩展的潜在探索评分(ScaLES)来减轻潜在空间优化中的过度探索问题,通过利用训练解码器对数据分布的近似来进行计算,ScaLES 提高了解决方案的质量,同时保持较高的客观值,从而改进了现有的解决方案。
PDF
22 days ago
快速和遗憾最优的最佳臂识别:基本限制和低复杂度算法
通过介绍一种新算法 ROBAI 和其变种,该研究识别并解决了在带有双重目标的多臂赌博机问题中达到最优臂的同时最大化奖励的难题;并对算法的停止时间、样本复杂性以及与经典 UCB 算法相比的性能进行了理论分析和数值实验,揭示出了经典 UCB 算
→
PDF
10 months ago
Prev
Next