Jun, 2024

在连续空间上学习条件分布

TL;DR研究的主题是在多维单位盒子上基于样本的学习条件分布,采用聚类方法,在特征空间中的变化查询点附近聚类数据来创建目标空间的经验度量。聚类方案包括基于固定半径球和最近邻的方法,通过收敛速率的上界确定最佳的半径和邻居数量。通过在实践中进行经验分析,我们的建议是将最近邻方法结合到神经网络训练中,因为它在实践中的性能更好。训练过程利用随机二进制空间划分进行近似最近邻搜索以提高效率。另外,我们使用Sinkhorn算法和稀疏强制传输计划。经验研究结果表明,通过适当设计结构,神经网络能够在局部适应适当的Lipschitz连续性水平。用于可复现性的代码可在https://github.com/zcheng-a/LCD_kNN找到。