Sep, 2023

TRAVID:一种端到端的视频翻译框架

TL;DR本文介绍了一种视频翻译系统,不仅能够翻译语言,还能将翻译的声音与说话者的唇部运动同步。该系统专注于翻译印度各种语言的教育讲座,在低资源环境中也能高效运行。通过将目标语言与说话者的唇部运动结合,并使用语音克隆技术将它们与说话者的声音匹配,我们的应用程序为学生和用户提供了更加沉浸式和真实的学习环境,从而增强了学习的效果和吸引力。