Nov, 2023

关于有条件音频生成中的开放提示挑战

TL;DR通过使用指令调整模型改写提示文本并利用文本音频对齐作为反馈信号,通过边界排序学习从而改善音频的质量和文本音频的对齐,从客观和主观的人类评估中观察到了明显的改善。