利用加权无重复抽样进行风险限制的财务审计
本文介绍了一种新的采样函数用于高效计算给定输入概率和昂贵函数评估条件下输入 - 响应系统的罕见事件统计量。我们的采样函数是最大似然加权采样函数的推广,通过两个额外参数的变化,可以解决原采样函数的两个弱点,并且我们还开发了一种在 Monte-Carlo 离散优化中实现加速的关键过程。通过多个测试案例的验证,我们展示了我们的新方法相对于原采样函数的优越性,最终我们将该方法应用于一个工程示例中,用于计算随机海况下船只罕见的滚动统计量。
Oct, 2023
探讨了 $L_1$ 正则化在价值函数逼近中的应用,介绍了一种基于 $L_1$ 正则化的近似线性规划方法(RALP):通过离线策略样本逼近最优价值函数并生成优于以往方法的策略;同时讨论了目标函数中状态关联权重和样本分布对模型逼近品质的影响,给出理论和实验结果,并提供了 RALP 擅长逼近的 MDP 类型。
Apr, 2014
本文提出了一种名为逆方差强化学习的贝叶斯框架,结合概率一致集和批次逆方差加权,采用两种互补的不确定性估计方法来更好地缓解深强化学习中嘈杂监督的负面影响,从而显著提高了离散和连续控制任务的样本效率。
Jan, 2022
本篇论文提出了一种基于模型的技术,在传输体验样本时自动估算每个样本与给定目标任务的关联性,以及在 RL 问题中使用重要性权重来解决负迁移问题,模型的结果经实验证明比目前最新的方法具有更好的学习性能和抗差能力。
May, 2018
预测多元时间序列的计算密集型任务中,重采样方法无法解决重尾分布损失的问题,为此我们引入了一种新的方法:高斯损失加权采样器,通过乘以高斯分布权重来减少选择极低或极高损失样本的概率,优化了训练效率并提高了预测质量。
Jun, 2024
采用似然比未知的情况下可估计的概率分类器进行样本权重优化的无似然比重要加权方法,可以用于校正生成模型中的偏差问题,并提高生成模型的样本质量和性能。
Jun, 2019
数字健康中的有限治疗预算分配策略,尤其是在风险时间的数量未知的情况下,需要在线近似算法来解决,该研究提出了两种在线近似算法,并使用竞争比分析给出了严格的理论性能保证,并通过合成实验和真实案例研究在 HeartSteps 移动应用中验证了算法的性能。
Feb, 2024
本文研究了带权低秩逼近算法的计算复杂度,并证明了即使在寻求秩为一的逼近解时,找到近似解也是 NP 难的,该证明基于最大边双团问题的约化并适用于严格正权重和二进制权重。
Dec, 2010