关键词$p$-wasserstein distance
搜索结果 - 2
- 流匹配实现最小极大均衡收敛
该论文讨论了流匹配在 $p$-Wasserstein 距离方面的收敛性质,通过研究一类更广泛的向量场的均值和方差函数,确定实现这些最优速率所必需的特定条件,并且证明了流匹配能够达到与扩散模型相当的收敛速率,从而为流匹配作为一种无需模拟的生成 - 分布式时间差分的统计效率
本文研究分布增强学习中的分布策略评估问题,并提出了非参数分布时序差分算法 (NTD) 来分析其有限样本性能,通过理论分析得出了 NTD 算法的迭代次数和估计误差之间的关系,同时也证明了 Categorical Temporal Differ