Apr, 2023

学习具有先验信息的基本权衡

TL;DR本文探讨学习者对问题的先验信息的准确性与其学习表现之间的基本平衡问题,介绍了优先风险的概念,提出了一种推广最小化上限技术的方法来限制统计估计问题的优先风险,同时为了限制更一般的损失而引入了 Fano's inequality 的新概念,展示了该框架在估计,回归和强化学习问题中,提供了先验信息和学习表现之间平衡的见解。