BriefGPT.xyz
大模型
Ask
alpha
关键词
word-level time alignment
搜索结果 - 1
OxfordVGG 参加 EGO4D AV 转录挑战
这篇报告介绍了我们(OxfordVGG 团队)参与 EGO4D 音频 - 视觉自动语音识别挑战 2023 的技术细节。我们提出了 WhisperX 系统,用于高效转录长篇音频,并具有单词级别的时间对齐,同时还提供了两个公开可用的文本规范化器
→
PDF
a year ago
Prev
Next