BriefGPT.xyz
Ask
alpha
关键词
lip videos
搜索结果 - 2
MM
野外任意说话人唇语合成
采用新型的 VAE-GAN 架构生成多说话者在野外拍摄的沉默唇视频中的语音,比其他基线模型表现更好,能够实现针对特定身份的微调和生成不同语音的语音序列。
PDF
2 years ago
TaL:一份同步的多说话人的舌头超声成像、音频和嘴唇视频语料库
本文介绍了 Tongue and Lips 语料库(TaL)的数据来源和处理方式,并在多个任务上对该语料库进行了基准测试,结果表明 TaL 可以用于语音识别和语音合成等任务。
PDF
4 years ago
Prev
Next