- ACL预测概率的解释:模型置信度还是人工标签变异性?
研究纸的主要议题和研究领域是 NLP 系统的不确定性评估,并讨论了预测分布对于模型信心和人类标签变化的指示的两种不同观点,推荐工具和展示了关于预测和人类标签不确定性的解耦表示的令人兴奋的方向。
- 在 ViT 特征空间中解耦结构和外观
我们提出了一种语义外观传输的方法,通过利用预先训练的和固定的视觉 Transformer(ViT)模型,提取深度 ViT 特征中结构和外观的新型解耦表示,然后通过 ViT 特征空间中的目标函数将这些表示相互编织在一起,提出了两种语义外观传输 - ACL用一种新颖的信息论目标分解表示以实现公平分类
从多种上下文环境的观察中提取现实的抽象表示是深度学习的一个追求目标之一。本文采用信息论的视角来研究这个问题,提出了一种新颖的正则化方法,称为 CLINIC 损失,通过大量的数值实验证明了这种方法在解缠表征与准确性之间取得更好的平衡,并且在不 - 通过拓扑学习进行解缠学习
通过加入多尺度拓扑损失项,我们提出了 TopDis(拓扑分解)方法,用于学习解耦表示。我们采用了一种不同的方法来分析数据流形的拓扑性质,并优化数据流形遍历的拓扑相似性,提出了一种可微分的解耦拓扑损失。我们的方法在无监督学习的情况下工作,并且 - 学习解缠离散表示
通过将标准的高斯变分自编码器(VAE)替换为量身定制的分类变分自编码器,我们探究了离散潜变量空间与解耦表示之间的关系。我们展示了分类分布的基础网格结构可以减轻与多变量高斯分布相关的旋转不变性问题,并作为解耦表示的高效先验。我们提供了分析和经 - DualVAE:控制生成和真实图像的颜色
本文提出了一种名为 DualVAE 的混合表示模型,通过学习颜色和几何特征的分离表示来控制彩色属性,这种模型可以通过转移来自示例图像的颜色潜在表征来重新着色现有图像,并且在各种数据集上表现出比 VQ-GAN 更好的 FID,包括动画面孔,标 - DDDM-VC: 分离降噪扩散模型与解缠表示及混合先验用于可验证的鲁棒语音转换
本文提出一种基于 DDDMs 和分离表示的生成模型,可以控制每个属性的风格,实现语音属性的解耦和控制,并进一步提出了先验混合的方法用于鲁棒语音风格转换。实验结果表明,我们的方法优于公开的 VC 模型,并提供了鲁棒的生成性能。
- 对话情感识别的解缠变分自编码器
本研究提出了一种基于 VAD-disentangled Variational AutoEncoder(VAD-VAE)的 ERC 模型,通过引入情感词汇表的 VAD 监督信号,最小化 VAD 分布之间的互信息来增强消解表示,并在两个数据集 - 基于词性的视觉语言模型子空间
本文提出了一种通过语法组件分解学习 CLIP 模型中视觉 - 语言联合空间不同视觉模态的基本变化,从而获得解耦的图像和模态表示的方法,并证明其在图像合成和零样本分类方面的有效性。
- 强化学习中的分离表示条件互信息
本研究提出了一种针对强化学习中存在相关特征的高维观察数据的辅助任务方法,通过最小化表示中特征的条件互信息来学习解缠缚表示,以提高对相关性变化的泛化能力。实验结果表明,该方法可以提高强化学习算法的训练性能和泛化能力。
- ICML自监督神经因子分析用于解开话语级语音表示的混杂信息
通过聚类方法和因子分析模型,使用自监督学习的特征对 SSL 模型进行有监督微调,可用于说话人、情感和语言识别等级别任务,并提供更具有区分性的音频特征表示,此方法在 SUPERB 基准测试中表现良好。
- 关于学习结构化表示的泛化
本文旨在研究用结构性表示学习的方法,具体分为解缠结表示与面向对象表示两个方向,以实现从非结构化数据中提取潜在结构信息的目的,同时还探讨了该方法对预训练表示和下游任务泛化能力的提升以及其对于大规模数据的高效表征学习的应用。
- CF-VAE:利用 VAE 和因果流进行因果分离表示学习
本文提出了一种结合因果结构信息的新型流模型 —— 因果流,设计了 CF-VAE 模型,通过利用因果流增强 VAE 编码器的解缠结能力。进一步引入地面真实因素的监督,证明了该模型的解纠缠可识别性。在合成和真实数据集上的实验结果表明,CF-VA - ICLRDAVA: 逆敌对变分自编码器解耦
介绍了一种名为 DAVA 的新型变分自编码器训练程序,该程序完全消除了超参数选择问题,发现了一种名为 PIPE 的无监督分离的必要条件,并证明了 PIPE 可以积极预测抽象推理中下游模型的性能。
- ICLRDCI-ES: 一种具有可识别性联系的扩展解缠框架
本文将 DCI 框架连接到线性和非线性可识别性的两个概念,提出了一个具有两个新的表示质量度量的扩展 DCI-ES 框架,并指出了如何为黑盒预测器计算 D 和 C;我们的主要想法是使用表示所需的功能容量是表示质量中至关重要的但迄今被忽视的方面 - ECCV图像操作中的监督属性信息去除和重建
本文提出了一种 Attribute Information Removal and Reconstruction(AIRR)网络,通过学习如何完全去除属性信息创建不包含属性信息的特征,然后学习在重建图像中直接注入所需属性,以避免信息隐藏问题 - ACL通过统计相似性度量学习解缠纠缠纷的文本表征
本文研究使用统计相似度度量为基础,构建了一种新的数据表述方法,不需要深度神经网络训练,快速且精度更高地进行敏感属性的鉴别,从而避免社会偏见。
- 多说者语音合成的细粒度噪声控制
本文提出了一种基于对抗训练、表示瓶颈和音框级建模的无监督噪音建模方法和基于全层次变分自编码器的细粒度语调建模方法,以更好地进行语音合成并将主要因素与噪声和背景噪声分离。
- 潜空间中的迷失:解缠模型和组合泛化的挑战
通过测试不同的数据集和训练方法,我们发现,当生成模型的编码器无法将新颖的组合映射到正确的潜在空间区域时,它们会失败。而当生成模型能够成功时,要么测试条件没有排除足够的样本,要么排除的生成因素能够独立地影响生成图像的不同部分。基于这些结果,我 - VAE 解缠结先决条件:感知重叠
本文研究如何通过修改重建损失来实现 VAE 的去纠缠表征,并提出一种广义对抗训练的数据集来破解现有的去纠缠框架。