AAAIDec, 2021

利用深层次声学表征从感知和原始语音中学习基于语境的语言

TL;DR本文研究基于视觉感知和语音输入的接地语言习得。作者利用最新的自监督语音表征模型进行了实验,并认为其可以使语言接地系统更具包容性,并减少依赖文本输入的影响。