BriefGPT.xyz
Ask
alpha
关键词
speech-text bimodal
搜索结果 - 1
跨可转移的语音转文大型语言模型对齐模块
利用大型语言模型(LLMs)和语音基础模型,先进的语音 - 文本双模工作可以实现复杂的任务,如口语翻译(ST)和问题回答(SQA),同时具有更简单的结构。本文利用 Whisper 编码器和预训练的 Yi-6B 的功能,通过经验结果发现,使用
→
PDF
17 days ago
Prev
Next