Jun, 2024

自我监督的语音表征更加语音学而非语义学

TL;DR本研究通过对自监督语音模型 (S3Ms) 的单词级别语言属性进行细致分析,发现 S3M 表示对于音韵相似性的相似度比语义相似性更高,并提出了对广泛使用的目标分类数据集进行语义能力评估的疑问。实验证明,即使只使用单词自身的信息,也能超越基于 S3M 的模型,在一些数据集上获得更高的性能,从而证实了研究结果,并暗示高分并不一定意味着语义内容的存在。