Oct, 2023

音视觉神经语法学习

TL;DR通过从视觉感知语音进行短语结构识别的研究,我们提出了语音 - 视觉神经语法学习器(AV-NSL),通过听音和看图,无需接触文本即可学习短语结构,训练集是配对的图像和口述字幕,AV-NSL 展示出推断有意义的短语结构的能力,对英语和德语都可以与自然监督的文本解析器推导出的结构相媲美,研究结果扩展了无监督语言习得和基于场景的语法识别的以前研究,并提出了一种桥接两个主题的方法。