May, 2018

音素到面音素的映射:好的、坏的和丑陋的

TL;DR本文探讨了应用可视嘴唇分类器时由于多对一的映射所产生的音素之间的歧义,证明了不同的音素到可视嘴唇映射之间的性能差异,提出了一种新的算法用于构建标记语音数据的音素到可视嘴唇映射,并且表明这种新的可视嘴唇 'Bear' 映射的性能优于以前的单位。