offline optimization | BriefGPT

关键词offline optimization

搜索结果 - 5

ICML离线多目标优化
离线优化涉及最大化一个黑盒目标函数，存在广泛的应用。然而，与离线单目标优化相比，离线多目标优化进展不足，主要原因是缺乏像单目标优化的 Design-Bench 这样的基准。为了填补这一差距，我们提出了离线多目标优化的第一个基准，覆盖了从合成
PDFa month ago
AAAI离线基于模型的优化：通过策略引导梯度搜索
离线优化是一个新兴的问题，在许多实验工程领域，包括蛋白质、药物或飞机设计，由于在线实验以收集评估数据费时或危险，必须在仅有一组固定输入的离线评估基础上优化一个未知函数。为了避免这种情况，可以学习一个未知函数的代理模型并对其进行优化，但这种简
PDF2 months ago
从函数到分布建模：离线优化的 PAC - 生成方法
该研究论文探讨了离线优化的问题，其中目标函数除了一系列 “离线” 数据示例外是未知的。与近年来关于将各种机器学习技术应用于离线优化问题的研究相比，大多数工作集中于学习未知目标函数的替代模型，然后应用现有的优化算法。与学习未知目标函数并优化它
PDF6 months ago
悲观的离策多目标优化
多目标优化的离线优化通过现有策略收集的数据进行优化；我们提出了一种悲观估计方法，基于倒数离差分数，可以轻松地插入现有的超体积计算公式进行优化。该方法不仅在理论和实验上改进了朴素的倒数离差分数估计方法，还可以通过策略梯度进行优化，在我们的所有
PDF8 months ago
重要性采样的策略优化
本文提出一种新的，无模型的策略搜索算法，POIS，它适用于基于动作和基于参数的设置，可在连续控制任务中有效地解决强化学习问题，通过离线优化新的轨迹批次来定义一个替代目标函数，并使用高置信度界限来解决估计的目标函数方差问题。
PDF6 years ago