关键词conditional mean embedding
搜索结果 - 4
- 压缩的条件均值嵌入在线学习
通过算子值随机梯度下降的增量式学习算法,可以逐渐从数据中学习条件均值嵌入(CME),以便在大数据情况下处理可扩展性挑战,并在目标 CME 不包含在假设空间中时,提供在线压缩操作学习算法的有限样本性能保证。
- 线性函数逼近下的最小化最优离线策略评估
本文研究利用函数逼近的批量数据强化学习的统计理论,针对离线策略评估问题提出了基于回归的适应 Q 迭代方法,证明该方法是信息理论上的最优方法,错误估计接近最小,进而提供容易计算的置信区间,该方法在乐观规划和安全策略改进中可能有用
- 测度论方法对条件均值嵌入的核分析
使用无算子、测度论方法,将条件均值嵌入(CME)作为在再生核希尔伯特空间中取值的随机变量进行了处理,并推导了一种自然的回归解释来获得经验估计,提供了彻底的理论分析,包括通用一致性。作为自然副产品,我们获得了最大均值差异和希尔伯特 - 施密特 - 核均值嵌入分布:综述与发展
该文介绍了一种基于希尔伯特空间嵌入的分布表征方法,该方法利用再生核希尔伯特空间将分布映射到一个空间中,并扩展了一般支持向量机和其他核方法的整个内核方法库,为概率测量、统计推断、因果发现和深度学习等领域提供了广泛应用,并讨论了该方法的理论保证