BriefGPT.xyz
大模型
Ask
alpha
关键词
continuous-valued audio embeddings
搜索结果 - 1
EMNLP
基于连续词大小的音频令牌的生成式口语模型
基于连续值音频嵌入的生成式口语语言模型(GSLM)通过引入词大小连续嵌入函数、对比损失和 k-NN 采样,取得了多样性和富有表现力的语言生成;该模型与离散单元 GSLM 在生成质量方面表现相当,同时内存效率提高了五倍;此外,词嵌入前后的嵌入
→
PDF
9 months ago
Prev
Next