音乐转录的最优频谱传输
神经音频信号处理中,通过使用基频调节来增强合成器性能,但是通过使用标准的音频重建损失函数联合训练基频估计器和合成器是一种挑战,从而依赖于外部的基频跟踪器。为了解决这个问题,我们提出使用受到最优传输理论启发的谱损失函数来最小化谱能量的位移。我们通过无监督的自编码任务在谐波信号上拟合谐波模板来验证这种方法。我们使用轻量级编码器共同估计基频和谐波的幅度,并使用可微的谐波合成器重构信号。这种方法为改善神经音频应用中的无监督参数估计提供了有前途的方向。
Dec, 2023
本文介绍了一种基于非线性字典学习的新方法,它通过使用最优传输理论来重构直方图,同时学习出字典原子和权重向量以实现优化传输重构,该方法允许原子和输入数据之间的非线性关系,可应用于多个图像处理场景。
Aug, 2017
研究使用 MUSIC 算法以及 Hankel 矩阵和噪声相关性等方法,解决在一定区间内单个快照测量的线谱估计问题,并证明该算法在低信噪比和频率分离度低时表现更优越。
Apr, 2014
本文提出了一种基于最优传输理论的无监督去噪学习标准,该标准具有优秀的性质,能够实现近乎完全保留信号信息并实现感知重构。实验结果表明,该方法比监督方法具有更好的感知重构和更高的峰值信噪比,尤其在复杂噪声等恶劣实际条件下表现出卓越的优越性。
Aug, 2021
提出了一种基于小批量学习匹配 (m-LTM) 框架的音频 - 文本检索方法,包括使用小批量子采样和马氏增强的地面度量系列以及使用部分最优传输来应对训练数据中的错位数据对。在多个数据集上的实验证明,该方法能够学习丰富、表达力强的联合嵌入空间,并取得了 SOTA 性能,同时能够弥补音频和文本嵌入之间的模态差距,在 ESC-50 数据集的零样本声音事件检测任务中超越了三元组和对比损失方法。值得注意的是,在音频数据集 AudioCaps 上,在训练数据中的噪声比例变化时,采用部分最优传输的 m-LTM 策略表现出比对比损失更大的噪声容忍度。
May, 2024
通过构建可决定的耦合(即传输图)来进行测量传输的基本原理,从而能够在质量复杂的概率分布中生成任意多且无权重的样本。该研究探讨了在仅可用非标准化目标密度评估或仅通过有限样本集合而已知目标分布的情况下,如何构建传输。该方法可直接应用于贝叶斯计算和基于随机模拟的广泛问题中。
Feb, 2016
基于最优输运解释的非线性滤波方法通过模拟和无似然算法估计从当前状态分布到下一个时间步的 Brenier 最优输运映射,利用神经网络建模复杂和多模态分布以及采用随机优化算法提高可伸缩性,通过广泛的数值实验与 SIR 粒子滤波器和集合卡尔曼滤波器进行比较,展示了我们方法在样本效率、高维可伸缩性和捕捉复杂和多模态分布等方面的优越性。
Oct, 2023
提出了一种自动钢琴转录系统,该系统利用基于深度神经网络的多音高检测和基于统计模型的节奏量化相结合的方法提高了音乐信息处理的准确性,在系统性评估中发现一些全局特征误差较大,而由音乐知识推导的音高和节奏内容的非局部统计显著提高了转录结果的准确性。
Aug, 2020
利用测度传输方法和三角形传输图来支持生物科学研究,在数据稀缺的情况下,通过计算稀疏自适应的传输图,发现这种方法有助于揭示辐射生物学中基因关系和辐射暴露下基因动态的隐藏信息。
Sep, 2023
该论文提出了一种利用谱嵌入方法来解决分布式能源资源对配电网中变压器过载的问题,通过使用电压基拉普拉斯矩阵的前 k 小的特征值辨别电表和母变压器之间的映射关系,该方法通过 IEEE 测试系统和真实饲养器的数字模拟实验证明了其可行性。
May, 2022