BriefGPT.xyz
大模型
Ask
alpha
关键词
self-attention-based audio encoder
搜索结果 - 1
利用 PaSST 和大量音频标题数据集推进基于自然语言的音频检索
该研究针对预先训练的文本和频谱图变换器,提出了一种基于文本的音频检索系统。系统的两个关键组件是基于自注意力机制的音频编码器和在预训练期间利用附加的人工生成和合成数据集。该系统在 2023 年的 DCASE 挑战中排名第一,在 ClothoV
→
PDF
a year ago
Prev
Next