BriefGPT.xyz
大模型
Ask
alpha
关键词
oneavm
搜索结果 - 1
一种统一的音视频学习框架:局部化、分离与识别
该研究提出了一种名为 OneAVM 的联合学习框架,该框架可以用于音频 - 视频源定位、分离和识别任务,其中共享的音频 - 视频编码器和任务特定的解码器是通过三个目标进行训练,包括本地化的音频 - 视觉对应丢失、视觉源分离和选择和用于强化视
→
PDF
a year ago
Prev
Next