Jun, 2022

Burst2Vec: 一个对抗性多任务方法,用于从声音爆发中预测情感、年龄和来源

TL;DRBurst2Vec 使用预训练的语音表示法和对抗性训练来捕捉原始波形中的声学信息,并实现了从声音短暂的预测情感、年龄和来源的多任务学习方法,相比使用预先提取的特征的基线,我们的模型取得了相对 30% 的性能提高,并在 ICML ExVo 2022 多任务挑战赛中成为所有参赛者中得分最高的。