Apr, 2023

软动态时间规整用于多音高估计及拓展

TL;DR本文介绍了一种处理音乐信息检索中涉及的弱对齐数据的新技术 —— 软动态时间规整(SoftDTW),这是一种可微分的经典动态时间规整(DTW)变体,相较于 CTC 算法在算法形式上更加优雅,能够自然地扩展到实值目标序列,并在多标签问题方面达到了 CTC 最新扩展的水平,文中以多音调估计为例具体论述了该技术。