关键词end-to-end model architecture
搜索结果 - 2
- CoSTA: 使用对齐的语音文本交替进行混合编码的语音翻译
通过先前训练好的自动语音识别 (ASR) 和机器翻译 (MT) 模块的结合,本研究提出了一种名为 COSTA 的端到端模型架构,用于印度语言到英文文本的混合语言实时翻译,并发布出相关评估基准。COSTA 在混合语言的孟加拉语、印地语、马拉地 - 基于音频文本的关键字定位的潜在编码匹配
本文提出了一种基于语音 - 文本嵌入的端到端模型的架构,使用动态规划算法将音频序列与基于单词的文本序列相同长度地划分,并提出了 DSP 方法,实现了音频 - 文本的对齐,实验结果表明,该模型在 ROC 曲线下的面积和等误差率方面优于现有技术