- 优化端到端自动语音识别的字节级表示
我们提出了一种对字节级表示进行优化的新方法,通过使用自编码器和向量量化,在自动语音识别中实现更好的准确性。
- ICML一种促进独立性的损失函数用于语言模型生成音乐
介绍了一种应用于音乐生成的语言模型的自动编码器作为标记器的独立性促进损失,通过减少码书之间的统计相关性,提高了生成音乐的质量和速度。
- 网络攻击检测中的可分离表示学习双自编码器模型
表示学习对于包括网络攻击检测在内的许多问题的成功起到了关键作用。 大多数用于网络攻击检测的表示学习方法基于自动编码器(Auto-Encoder)模型的潜在向量。 为了解决这个问题,我们提出了一种新的模型,称为双自动编码器(Twin Auto - FFAD:利用傅立叶变换和自编码器评估生成的时间序列数据的新型指标
通过使用傅里叶变换和自编码器,提出了一种新的评估基于深度学习生成的时序数据质量的方法,命名为 Fréchet Fourier-transform Auto-encoder Distance (FFAD),该方法展示了在区分不同类别样本方面的 - MIMO CSI 反馈的通用自编码器框架
提出了一种通用自编码器框架来支持不同的输入大小和多个压缩比,与其他方法相比,在压缩比和失真之间提供了可比较的性能,同时显着降低了硬件复杂性。
- 局部自适应神经网络三维形态模型
我们提出了本地自适应可塑模型(LAMM),这是一个高度灵活的自编码器(AE)框架,用于学习生成和操纵 3D 网格。我们的模型通过自监督训练方案,使用输入的位移来覆盖编码的几何形状,以实现从一个训练样本转换到另一个样本。在推断过程中,我们的模 - 3D-QAE:全量子三维点云的完全自编码
该论文介绍了首个用于三维点云的量子自动编码器,通过在模拟的基于门的量子硬件上进行实验,证明了该方法优于简单的经典基准模型,为三维计算机视觉领域开辟了新的研究方向。
- DiffDub:使用扩充自动编码器的修复渲染器进行人物通用视觉配音
通过 Diffusion-based dubbing 方法,我们提出了 DiffDub 自动编码器,可以实现高质量的视觉配音,包括无痕填充和人物特定纹理等创新性策略,通过全面的实验证明,我们的方法在人员通用和多语言场景中优于现有方法,并提供 - fMRI-PTE:一种用于多被试脑活动解码的大规模 fMRI 预训练 Transformer 编码器
脑活动解码的研究一直以来都是一个持久的追求,具有脑机接口、医学诊断和虚拟现实等潜在应用。我们提出了一种创新的 fMRI 预训练自编码器方法(fMRI-PTE),专注于解决因个体脑差异导致的 fMRI 数据维度变化的挑战。我们将 fMRI 信 - 跨域鲁棒式深度伪造偏差扩展网络用于人脸伪造检测
本研究介绍了一种名为 Cross-Domain Robust Bias Expansion Network (BENet) 的解决方案,通过使用自动编码器和潜空间注意力模块,增强面部伪造检测的鲁棒性,用于优化重建结果和放大伪造线索以及检测跨 - 神经视觉器:基于自编码器的损失面可视化方法
本文介绍了一种名为 Neuro-Visualizer 的新型基于自动编码器的非线性景观可视化方法,通过实验证明其在神经网络损失景观方面的潜力,超过了其他线性和非线性基准,并帮助证实和挑战机器学习社区提出的观点。
- 使用确定性投影信念网络改进的自编码
本文研究了一种基于确定性投影信念网络 (D-PBN) 的自动编码器,并利用可训练的复合激活函数 (TCAs) 的独特性质进行优化,实现更好的数据分析和重构性能,超过了标准自动编码器和变分自动编码器。
- 面板自编码器用于图像异常检测
无先验异常检测是具有挑战性的。我们提出了一种新型的分块自编码器(Patch AE)框架,旨在增强自编码器对异常图像的重构能力而不是削弱。通过对学习到的特征表示的空间分布特征向量的相应位置进行重构,即分块重构,确保了自编码器对异常的敏感性。我 - 深度双重自表达子空间聚类
本文提出了一种双自表达子空间聚类算法,利用自表达系数构建相似度矩阵进行谱聚类,并提出了基于对比学习的自监督模块,该算法在多个基准数据集上实现了比现有方法更好的聚类表现。
- PCF-GAN: 通过路径空间上的测度特征函数生成序列数据
本文提出了一种名为 PCF-GAN 的新型生成对抗网络,将路径特征函数(PCF)作为时间序列分布的原则表示,并将其并入鉴别器以增强其生成性能,同时通过序列嵌入将自编码器结构集成到模型中,实现了复杂时间序列数据的生成和重构。实验证明,PCF- - 利用自编码器进行关联规则挖掘
本文提出一种基于自编码器的关联规则挖掘算法 ARM-AE,通过比较三个分类数据集上的实验结果表明,该算法能够高效且准确地挖掘出高置信度和支持度的关联规则。
- 二元潜在扩散
本文基于自动编码器训练了一个伯努利编码分布的二元潜空间模型,用于图像压缩和高分辨率图像生成。结果表明该方法无需使用多级层次结构即可大幅提高采样效率,生成的图像质量好且效果与现有先进方法相当。
- 连续不定概率神经网络
引入了一种新的模型 ——CIPNN(连续不定概率神经网络),是基于 IPNN 的模型,用于处理离散潜在随机变量。本文提出了新的理论解决了连续潜在随机变量后验的计算问题,创新地提出了基于概率的自编码器 CIPAE,并且提出了一种视觉化方法及进 - 半监督反事实解释
通过引入自编码器重建损失,将分类器输出结果与自编码器的潜空间相连接,从而提高干预解释搜索过程的速度和解释干预结果的可解释性,尤其在自编码器以半监督方式训练的情况下进一步提高了其解释性。在多个数据集上的实验验证了该方法的有效性。
- ZeroNLG: 零射击多模态和多语言自然语言生成的领域对齐和自编码
该论文提出了一个直觉有效的零样本学习框架 ZeroNLG,它可以在英语、中文、德语和法语之间处理多个自然语言生成任务,包括图像到文本、视频到文本和文本到文本。该框架不需要任何标记的下游对来训练,并通过 bridging different