Feb, 2024

探索面向通用音频理解的联邦自监督学习

TL;DR通过将联邦学习(FL)与自监督学习(SSL)相结合,可以在不损害用户数据隐私的情况下利用音频数据进行通用音频理解。本文评估了在大规模非独立同分布(non-iid)数据生成的情况下,将特征匹配和预测式音频自监督学习技术与 FL 相结合的性能,提出一种名为 FASSL 的新型联邦自监督学习(F-SSL)框架,并通过广泛实验证明了 FASSL 的有效性和重要性,从而有助于获得最佳的全局模型。