关键词kl divergence
搜索结果 - 39
- ICML灾难性古哈特:使用 KL 散度对 RLHF 进行正则化不能缓解重尾奖励错误规定PDF6 days ago
- 变分最优 N 对齐PDF17 days ago
- 通过维度对数 Sobolev 不等式在概率测度中精确检测低维结构PDFa month ago
- Wasserstein 梯度流的 Forward-Euler 时间离散可能存在问题PDFa month ago
- 贝叶斯核心集质量的一般界限PDF2 months ago
- 无对抗训练的深度最大均值差梯度流PDF3 months ago
- 令牌级直接优化偏好PDF3 months ago
- 优于 KL 的 PAC-Bayes 界PDF5 months ago
- 最佳 N 对齐策略的理论保证PDF7 months ago
- AAAI基于条件变分自动编码器的手语翻译与跨模态对齐PDF7 months ago
- 通过在 Wasserstein 空间中的多面体优化实现均场变分推断的算法PDF8 months ago
- 一步扩散与分布匹配蒸馏PDF8 months ago
- 初始化对过参数化神经网络的隐私 - 效用分析PDF9 months ago
- 基于 Wasserstein 分配鲁棒性的上下文强化学习策略评估与学习PDF10 months ago
- 使用本地线性模型的变分梯度下降PDFa year ago
- 在 Bures-Wasserstein 空间中通过 JKO 实现前向后向的高斯变分推断PDFa year ago
- 使用 Tsallis KL 散度的广义 Munchausen 强化学习PDFa year ago
- 政策优化的贪婪算子:研究正向和反向 KL 散度PDF3 years ago
- 使用前向 Kullback-Leibler 散度进行重要性采样的变分细化PDF3 years ago
- 宽广场(Wide)均场变分贝叶斯神经网络忽视数据PDF3 years ago
Prev