Jul, 2023

以需求驱动的方式理解生成音频人工智能

TL;DR本文通过对专业音频工程师的调查,确定研究优先事项和定义各种研究任务,总结了当前音频质量和可控性方面的挑战,并强调了数据集的可用性目前是实现高质量音频生成的主要瓶颈。最后,我们根据经验证据提出了解决一些问题的潜在解决方案。