BriefGPT.xyz
Ask
alpha
关键词
information-geometric
搜索结果 - 2
许多深层网络的训练过程可以被解释为探索同一低维流形
通过信息几何技术,分析深度网络在训练过程中的预测轨迹,揭示了网络训练过程中探索了一个有效低维度流形,在预测空间中,不同架构、大小、训练优化方法、正则化技术、数据增强技术和权重初始化的网络都在同一个流形上,并研究了该流形的细节,发现不同的网络
→
PDF
a year ago
从头开始的稀疏变分推断:基于贝叶斯核心集
本研究提出了一种基于稀疏约束变分推断视角的 Riemannian coresets 构建算法,与过去的方法相比,该算法不需要一个合理的后验近似。实验结果表明,提出的算法能够不断改善 coreset,大大减小 KL 散度,从而提供最先进的 B
→
PDF
5 years ago
Prev
Next