Apr, 2024

Llama-VITS: 基于语义意识的 TTS 合成增强

TL;DR最近的自然语言处理(NLP)的进展中,大型语言模型(LLMs)在多个应用方面展现出了出色的高质量文本生成能力。本研究引入了一种创新的方法 Llama-VITS,在文本的语义内容方面通过 LLM 来增强 TTS 综合效果。借助 Llama2 来进行主要语音合成过程,我们的实验表明,Llama-VITS 在 LJSpeech 数据集上与原始 VITS(ORI-VITS)和集成 BERT 的模型(BERT-VITS)的自然性相当,并且在 EmoV_DB_bea_sem 数据集上显著提高情感表达能力,突显其生成情感语音的潜力。