- 自抽取去缠结学习用于反事实预测
基于信息论的自我蒸馏位解缠框架,通过互信息最小化提供理论上可靠的独立位解缠表示,以促进存在观察和未观察混杂变量的反事实推理。
- CVPR选择所需:场景文本识别、去除和编辑的解缠表示学习
基于现有样式和内容信息紧密耦合的特征,本研究提出了一种分解表示学习框架 (DARLING),旨在通过分离这两种特征来提高适应不同下游任务的能力。实验结果表明,我们的方法在场景文本识别、去除和编辑方面取得了最先进的性能。
- 通过解开图像的外貌与内容之间的关系,进行联合质量评估和示例引导的图像处理
通过深度学习技术和分解表示学习方法,该研究提出了一种新的质量预测模型 DisQUE,并展示了其在图像处理任务和 HDR 色调映射中的应用。
- PromptCodec:基于分离表示学习的自适应特征感知提示编码的高保真神经语音编解码器
利用解耦表示学习为基准的特征感知提示编码器,我们提出了 PromptCodec,这是一种创新的端到端神经语音编解码模型,用于高压缩比下确保音频重建的高保真度。PromptCodec 通过整合提示编码器的额外特征表示,可以分配需要处理的语音信 - DrFER:学习面部表情三维识别的解耦表示
创新的 DrFER 方法在 3D 人脸领域引入了概念上的解缠表示学习方法,通过使用双分支框架,有效地将表情信息与身份信息解耦,并通过重新配置损失函数和网络结构适应于点云数据,从而提高了框架在识别面部表情方面的能力,即使在涉及不同头部姿势的情 - 跨注意力的扩散模型作为串扰的归纳倾向
我们提出了一种新的视角和框架,论证了扩散模型与交叉注意力可以作为强大的归纳偏好来促进解缠表示的学习,通过对概念标记的交叉注意力桥接编码器和扩散之间的交互,在基准数据集上不经过额外正则化就实现了卓越的解缠性能,超过了所有之前采用复杂设计的方法 - 利用深度学习发现科学图像数据的可解释模型
通过使用可解释的模型,我们研究如何从复杂图像数据中得出科学洞见,并通过实现解缠表示学习、稀疏深度神经网络训练和符号回归等方法,对复杂图像数据形成可解释的模型进行评估,以及探索这些可解释模型在揭示潜在生物现象方面的用途。
- 无概念因果分解变分图自编码器
提出了一种无监督学习的解决方案,称为无概念因果分解 (disentanglement),通过在可观测数据中直接学习概念结构,提出了 CCVGAE 和 CC-Meta-Graph 模型,并在 AUC 方面分别取得了高达 29% 和 11% 的 - 学习解缠绕语音表示
利用综合研究人工数据集 SynSpeech 来评估监督技术在语音表征解耦上的效果,弥补有限的语音数据集缺乏已知生成因素的问题,为现有最先进的语音表征学习方法提供全面的评估和框架,进一步推动这个相对较少探索的领域的发展。
- 透明信息瓶颈下的解耦表示学习
通过传递信息的贝叶斯网络,我们引入了 DisTIB(传递信息瓶颈)作为一种导航信息压缩和保留之间平衡的新目标,通过可变推理和重参数化技巧获得了可优化的估计,实验证明其能够实现最优的解缠效果。
- 在线多视图异常检测与解耦专家模型
本文提出了一种新颖的多视角变分自编码器模型 dPoE,通过多视角学习、解耦表示学习和生成模型的思想,使用产品 - 专家层、总校正鉴别器和联合损失函数解决多视角数据中的异常检测问题,并且在控制视角通用和视角特定表示方面设计了理论信息界限,大量 - 改进 SCGAN 的相似性约束并学习更好的解耦表示
SCGAN 通过在生成对抗网络中添加生成图像和条件之间的相似性约束作为正则化项。我们理解 SCGAN 如何在更深层次上工作,该理解让我们意识到相似性约束类似于对比损失函数。我们相信,一个具有高理解力和智能的模型可以像人类一样通过结构和高级特 - 通过逐层维度选择从预训练语言模型中解析单词语义
该论文使用二进制掩码对预训练模型中不同层的输出进行切割,以解离 BERT 中的语义意义,而不更新预训练参数,从而产生解离的嵌入表示。使用二进制分类验证解离的嵌入的效果,判断两个不同句子中目标词的含义是否相同。实验结果表明,利用层次信息是有效 - C$^2$VAE:基于高斯 Copula 的 VAE:区别由相联系的表示进行解耦的对比后验
我们提出了一种自我监督的变分自动编码器(VAE),通过自我监督分类器来消除耦合表示,并联合学习解缠的和相关的隐藏因素。
- 3D 人体姿势估计中的姿势和外貌解耦的理解
我们通过对自监督学习下三维人体姿势估计方法进行深入分析,测试了现有的分离表示学习方法从外貌信息中分离出姿势信息的程度,并发现这些方法的姿势编码包含了相当数量的外貌信息。
- FedDCSR:通过分离表示学习实现联邦跨领域顺序推荐
本文提出了一种名为 FedDCSR 的新型联邦跨领域顺序推荐框架,通过解耦表示学习来解决不同领域间的序列特征异质性问题,并通过在用户序列上进行数据增强来学习更丰富的领域专属特征,实验证明 FedDCSR 相较于现有基线方法有显著的改进。
- 基于互信息最大化的实时无人机跟踪学习解耦表示
利用互信息最大化的分解表示学习(DR-MIM)来进一步提高无人机跟踪的深度学习(DL-based)跟踪器的精确度和效率。通过将特征分解为与身份相关和与身份无关的特征,仅使用后者,从而增强下一步的分类和回归任务的特征表示效果。广泛的实验表明, - 基于向量的表示是关键:有关解缠和组合泛化的研究
在人工智能领域,学习并拥有类人类的智能需要处理认知的本质概念和生成这些概念的新的组合的能力,本文研究了这两种能力之间的关系,并发现基于向量的表示方法可以提高这两种能力,此观察结果与神经科学研究一致,为实现类人智能迈出了重要一步。
- 用潜在量化实现解缠
通过强化模型正则化并将潜空间量化为可学习的离散代码,本文提出一种面向组成性编码和解码的概念偏置,从而在许多基准数据集上显著改善了学习表示的模块化和明确性。
- 丰富分离:从定义到度量
本文研究了解离散表示学习的定义,并介绍了将等式定义转化为基于丰富范畴论的相容量化评估标准的系统方法。我们提出了适用于评估去迭代复杂数据的可分离表示抽取器所需性质的量化度量标准,并展示了它们在合成数据上的有效性。我们的方法为研究人员选择合适的