BriefGPT.xyz
大模型
Ask
alpha
关键词
speech-text
搜索结果 - 2
口语对话建模的统一语音文本预训练
提出了一个名为统一口语对话模型(USDM)的广泛的语音文本模型框架,用于生成与给定输入语音相关的有机韵律特征的连贯口语回应,而不依赖于自动语音识别(ASR)或文本到语音(TTS)解决方案。该方法利用底层大型语言模型所展示的推理链能力,采用多
→
PDF
5 months ago
JOIST:一种联合语音和文本流模型用于自动语音识别
我们提出 JOIST 算法,使用音频文本配对输入和仅文本未配对输入训练流式级联编码器端到端模型。与以往的工作不同,我们探索了同时训练两种模态的联合训练方法,而不是预训练和微调。此外,我们使用了一种流式端到端模型,并增加了一个数量级的数据量,
→
PDF
2 years ago
Prev
Next