BriefGPT.xyz
Ask
alpha
关键词
mmd
搜索结果 - 3
知识蒸馏中重新思考聚焦核对齐
使用 CKA(Centered Kernel Alignment)理论有效地将大规模模型和轻量级模型之间的表达差异解耦为 MMD(Maximum Mean Discrepancy)的上界和一个常数项,提出了一种新颖的 RCKA(Relati
→
PDF
5 months ago
MMD GANs 的梯度正则化
本文提出了一种基于 MMD 核的 GAN 模型正则化的梯度的原则性方法,证明控制批评者的梯度对于有意义的损失函数至关重要,并设计了一种方法来实施精确、分析梯度约束,使得新的损失函数具有连续性,并证明实验表明它可以稳定和加速训练,为 160
→
PDF
6 years ago
ICML
通过限制概率测度实现 f - 分歧的更紧凑变分表示
本文通过收紧文献中已使用的 f-divergences 变分表示方法,提出了更紧的表示方法。作为一个示例应用,我们使用更紧的表示法推导出一种基于两个独立同分布样本的通用的 f-divergence 估计器,并推导出该估计器的对偶程序,在实践
→
PDF
12 years ago
Prev
Next