COLINGApr, 2024

走向狗吠解码:利用人类语音处理进行自动狗吠分类

TL;DR本文研究狗的声音,并探索利用在人类语音上预训练的自监督语音表示模型来解决狗吠分类任务,该任务与人类语音识别中的任务有相似之处。我们具体研究了狗的识别、品种鉴定、性别分类和语境关联四个任务,并表明使用语音嵌入表示可以显著改善简单分类基线。此外,我们还发现在几个任务中,预训练于大规模人类语音声学的模型可以提供额外的性能提升。