AAAINov, 2022

TimbreCLIP: 连接音质、文本和图像

TL;DRTimbreCLIP 是一个音频文本交叉模态嵌入,通过单个乐器音符训练,通过合成器补丁的交叉模态检索任务评估模型,最后展示了在文本驱动音频均衡和音色图像生成两个任务上应用 TimbreCLIP。