Jan, 2025

实时无文本对话生成

TL;DR本研究解决了传统语音对话系统自然性不足的问题,提出了一种实时无文本对话生成模型(RTTL-DG)。该模型通过直接处理流式语音对话,实现了流畅的轮流对话,并引入了回传信号、过滤器、笑声等副语言信号,以提高互动的自然性和人性化水平。