ICLRNov, 2019
从视觉语言到学习层级离散语言单元
Learning Hierarchical Discrete Linguistic Units from Visually-Grounded Speech
David Harwath, Wei-Ning Hsu, James Glass
TL;DR本文中提出了一种通过将向量量化层整合到基于视觉语音的神经模型中来学习离散语言单元的方法。我们展示了我们的方法可以捕捉到单词级别和子词级别的单元,我们还将子词单元应用到了 ZeroSpeech 2019 挑战中,取得了较好的结果。