speaking styles | BriefGPT - AI 论文速递

关键词speaking styles

搜索结果 - 4

推动大型语言模型在口语对话中捕捉多样的言谈风格并作出恰当回应
在口语对话中，即使两个当前对话相同，它们的回应在不同的语言风格中可能仍然不同。这篇论文提出了一种 Spoken-LLM 框架，旨在教导 LLMs 理解和适当回应不同的语言风格，并使用 StyleTalk 数据集进行训练，通过两个阶段的训练使
PDF4 months ago
StyleCap：基于语音和语言自我监督学习模型的自动口语样式字幕生成
StyleCap 提出了一种生成自然语言描述语音中出现的语言风格的方法，通过训练神经网络来预测前缀向量，并使用一个大型语言模型（LLM）的文本解码器从语音表示向量生成说话风格提示。
PDF7 months ago
基於實境影像的音頻驅動 3D 臉部動畫
本文提出了一种基于 2D 口型视频和 3D 面部重构方法训练的 3D 面部动画模型，该模型具有良好的泛化能力和包括口型同步在内的高保真度，能够捕捉不同个体的讲话风格并输出个性化的 3D 说话头像，经实验证明其优越性。
PDFa year ago
不同领域专家合作，培养全才
本文提出一种基于多领域音频模型的教师 - 学生训练框架，成功地构建了一个应用于多个领域的音频模型，通过对两种不同域名的语音风格实验验证效果，取得了比基线模型（多条件模型）更好的结果，相对字符错误率提高达到了 10.4%。
PDF5 years ago