BriefGPT.xyz
大模型
Ask
alpha
关键词
audio tokens
搜索结果 - 2
DASB -- 离散音频和语音基准
通过发布离散音频和语音基准 (DASB),我们研究了离散音频标记符在各种任务中的性能表现,并发现语义标记比压缩标记在大多数任务中表现更好,但语义标记和标准连续表示之间的性能差距仍然存在。
PDF
14 days ago
如何从自监督模型中提取离散音频标记?
这篇论文探讨了语义标记的最佳配置,提出了训练通用声码器的可扩展解决方案,并使用注意机制来提高语义标记在多种音频应用中的适应性和性能。
PDF
19 days ago
Prev
Next