BriefGPT.xyz
Ask
alpha
关键词
pure-exploration multi-armed bandits
搜索结果 - 2
多分布学习的分布相关速率
为了应对敏感机器学习应用中的不确定性建模需求,分布鲁棒优化(DRO)的设置在各种任务中寻求统一的良好性能。最近的多分布学习(MDL)框架以与环境的动态互动的方式解决了这一目标,在该框架中,学习者可以对每个目标分布进行采样访问。借鉴了纯探索多
→
PDF
7 months ago
AAAI
互信息准则的主动特征选择
本文针对标签信息有限的情况,提出了基于互信息和纯探索多臂老虎机的主动特征选择算法,并通过实验证明了其有效性。
PDF
4 years ago
Prev
Next