BriefGPT.xyz
大模型
Ask
alpha
关键词
acoustic representation
搜索结果 - 2
通过下采样声学表示进行端到端语音识别的纯文本领域自适应
本研究旨在通过引入一个连续的整合 - 发火 (CIF) 模块,从而实现将语音和文本这两种形式的信息映射到共享表示空间,以提高自动语音识别 (ASR) 在新领域中的性能。通过将一个具有一致语音标记长度的 CIF 模块与基于文本的 ASR 模型
→
PDF
10 months ago
NIPS
从无标注视频中学习声音表征的 SoundNet
通过使用大量的野外未标记的声音数据,我们利用视觉和声音之间的自然同步,使用两百万个未标记的视频学习声学表示,提出了一种学生 - 教师训练过程,将视觉知识转移到声音模态中,为声音场景 / 对象分类的标准基准提供了显着的性能提升,即使没有地面真
→
PDF
8 years ago
Prev
Next