BriefGPT.xyz
Ask
alpha
关键词
batch setting
搜索结果 - 4
ICLR
利用重要性权重进行子集选择
该研究提出了一种基于重要性抽样的子集选择算法,能够在批处理环境中提高模型训练的性能,在可用数据批次中选择样本。该算法在七个公共数据集上的性能明显优于其他子集选择算法,并且在标签信息不可用的主动学习环境中具有竞争力。研究还对其重要权重方法进行
→
PDF
a year ago
继续做有效的事情:行为建模先验用于离线强化学习
本文提出了一种能够适用于机器人控制等实际问题,同时在批处理状态下能够有效学习的算法,该算法采用了优势加权行为模型 (ABM) 来对先前执行过的成功动作进行刻画,并对新的任务中可能成功的动作进行策略偏置,实验表明我们的算法在标准连续控制基准测
→
PDF
4 years ago
基于批次的深度强化学习算法基准测试
本研究在 Atari 领域中利用单个部分训练的行为策略生成的数据对最近的离线策略和批量强化学习算法的性能进行了基准测试,并发现在这些条件下,许多算法表现不佳,而 Batch-Constrained Q-learning 算法适应离散动作环境
→
PDF
5 years ago
多个连续和分类输入上的贝叶斯优化
提出了一种基于混合类型空间的新方法 CoCaBO,它结合了多臂赌博机和贝叶斯优化的优点,使用高斯过程核来对包含连续和分类输入的黑盒问题进行优化,实现了在探索和开发之间的平衡,并在连续和分类输入的合成和实际优化任务上超越了现有方法。
PDF
5 years ago
Prev
Next