BriefGPT.xyz
Ask
alpha
关键词
audio-and-language pairs
搜索结果 - 1
CTAL:跨模态预训练 Transformer 用于音频和语言表示
本论文介绍了一种名为 CTAL 的跨模态转换器,旨在利用大量的音频和语言数据对两个代理任务进行遮蔽语言建模和遮蔽跨模态声学建模,以学习音频和语言之间的内模态和跨模态连接。在多个下游音频和语言任务的微调后,我们观察到在情感分类、情感分析和说话
→
PDF
3 years ago
Prev
Next