BriefGPT.xyz
Ask
alpha
关键词
speech duration
搜索结果 - 3
2022 年 NIST 语言识别评估
本文概述与分析了 2022 年美国国家标准与技术研究所进行的最新语言识别评估 (LRE22) 的系统表现,发现使用不同评估条件下 Oromo 和 Tigrinya 较容易识别,而 Xhosa 和 Zulu 则较为困难。此外,当语音时长增加时
→
PDF
a year ago
联合优化翻译和语音时序以改善自动配音中的等时间性
本研究提出了一种自动配音的模型,通过同时进行翻译和语音持续时间的优化,实现生成的配音更好地匹配原始视频的时间轴,同时简化了整个系统的结构。
PDF
a year ago
AAAI
VideoDubber: 视频配音的语音感知长度控制机器翻译
该研究针对影视配音中原始语音和目标语音的对齐问题,提出一种机器翻译系统,通过考虑语音时长控制翻译长度,构建了真实世界情景下的测试集,实现了对自然长度的更好控制。
PDF
2 years ago
Prev
Next