BriefGPT.xyz
大模型
Ask
alpha
关键词
offline optimization
搜索结果 - 5
ICML
离线多目标优化
离线优化涉及最大化一个黑盒目标函数,存在广泛的应用。然而,与离线单目标优化相比,离线多目标优化进展不足,主要原因是缺乏像单目标优化的 Design-Bench 这样的基准。为了填补这一差距,我们提出了离线多目标优化的第一个基准,覆盖了从合成
→
PDF
a month ago
AAAI
离线基于模型的优化:通过策略引导梯度搜索
离线优化是一个新兴的问题,在许多实验工程领域,包括蛋白质、药物或飞机设计,由于在线实验以收集评估数据费时或危险,必须在仅有一组固定输入的离线评估基础上优化一个未知函数。为了避免这种情况,可以学习一个未知函数的代理模型并对其进行优化,但这种简
→
PDF
2 months ago
从函数到分布建模:离线优化的 PAC - 生成方法
该研究论文探讨了离线优化的问题,其中目标函数除了一系列 “离线” 数据示例外是未知的。与近年来关于将各种机器学习技术应用于离线优化问题的研究相比,大多数工作集中于学习未知目标函数的替代模型,然后应用现有的优化算法。与学习未知目标函数并优化它
→
PDF
6 months ago
悲观的离策多目标优化
多目标优化的离线优化通过现有策略收集的数据进行优化;我们提出了一种悲观估计方法,基于倒数离差分数,可以轻松地插入现有的超体积计算公式进行优化。该方法不仅在理论和实验上改进了朴素的倒数离差分数估计方法,还可以通过策略梯度进行优化,在我们的所有
→
PDF
8 months ago
重要性采样的策略优化
本文提出一种新的,无模型的策略搜索算法,POIS,它适用于基于动作和基于参数的设置,可在连续控制任务中有效地解决强化学习问题,通过离线优化新的轨迹批次来定义一个替代目标函数,并使用高置信度界限来解决估计的目标函数方差问题。
PDF
6 years ago
Prev
Next