BriefGPT.xyz
大模型
Ask
alpha
关键词
speech encoders
搜索结果 - 3
揭示基于 LLM 的中文开源数据集上的 ASR 潜力
基于大型语言模型的自动语音识别研究,探索了多种配置下的语音编码器、语言模型和投影模块对 ASR 性能的影响,采用三阶段训练方法实现了在中文数据集上的最佳表现,为未来 LLM 基于 ASR 系统的研究提供了实证基础和性能优化的见解。
PDF
2 months ago
连接语音编码器和大型语言模型用于 ASR
该论文通过比较研究了三种常用的连接结构,包括全连接层、多头交叉注意力和 Q-Former,并对 Whisper 系列的语音编码器和 Vicuna 系列的大语言模型进行了实验,结果表明基于 Q-Former 的大语言模型相比其他连接结构在 L
→
PDF
9 months ago
虚拟代理的端对端口语实体提取
本文探讨了利用语音编码器从语音中直接提取实体的方法,研究表明这种直接的方法优化了编码器以仅转录语音中与实体相关的部分,忽略不必要的部分,并且在企业虚拟代理的对话中,优于传统的两步法。
PDF
a year ago
Prev
Next