BriefGPT.xyz
Ask
alpha
关键词
distributionally robust approach
搜索结果 - 2
上下文优化在协变量漂移下的鲁棒方法:通过相交的 Wasserstein 球
在上下文优化中,通过观察不确定变量的历史样本和相关联的并发协变量,不知道它们的联合分布。在给定附加协变量观测情况下,目标是选择最小化某些操作成本的决策。这里的一个普遍问题是协变量偏移,其中新协变量的边际分布与历史样本不同,导致具有非参数或参
→
PDF
a month ago
上下文强化学习中基于一般协变量转移的分布稳健策略评估
我们介绍了一种分布健壮的方法,用于在背景变量移位下增强上下文赌博的离线策略评估的可靠性。通过应用分布健壮回归技术改进条件奖励分布的估计,我们开发出一套综合的策略价值评估器,并通过理论分析证明了该方法相对于传统方法在偏移较大时的有限样本上限优
→
PDF
6 months ago
Prev
Next