Oct, 2023

罗马尼亚跨语言域自适应的端到端唇读

TL;DR该研究论文研究了视窗学习(或称视觉语音识别)的关键领域,采用各种架构和优化方法对基于罗马尼亚语言数据集的模型进行测试,并通过使用英语和德语数据集的无标签视频来帮助模型学习语言不变特征,进而提出跨语言领域自适应的方法,最终获得了尖端结果,并评估了模型中添加的神经抑制机制的性能。