BriefGPT.xyz
大模型
Ask
alpha
关键词
cross-modal model
搜索结果 - 1
融合语音和文本改进语音翻译
该研究提出了 FST 跨模态模型,支持语音、文本和语音文本融合三种不同类型的输入模态进行翻译,技术包括多模态对齐等方法,实验结果表明该模型在多项测试中比传统方法有显著提升,尤其是在语音翻译领域。
PDF
a year ago
Prev
Next