May, 2024

在规格不匹配设定下的通用批次学习

TL;DR在该论文中,我们考虑了在误差设置下的通用批次学习问题,其中假设类是一个模型集合,但数据是由未知分布生成的,可能不属于该集合,而是来自一个更大的模型集合。我们利用极小极大定理和信息论工具,推导出最优的通用学习器,即数据生成分布集合上的混合分布,获得了最小最大遗憾的闭式表达式。我们发展了一种扩展的Arimoto-Blahut算法用于遗憾值和达到容量的先验分布的数值评估。对于观测结果来自K个参数的多项式分布,而假设类是该分布族的子集的情况,我们展示了我们的结果。