BriefGPT.xyz
Ask
alpha
关键词
yfcc100m
搜索结果 - 2
ECCV
AudioScopeV2:音视频注意力架构的开放域屏幕声音分离校准
AudioScopeV2 是一个最先进的通用音频视觉屏幕上声音分离系统,能够通过观察野外视频来学习分离声音并将它们与屏幕上的对象关联起来,并提出了解决先前工作的若干限制的解决方案,并通过新的数据集进行评估,最终取得了显着的改进。
PDF
2 years ago
YFCC100M:多媒体研究的新数据
该研究介绍了雅虎 Flickr 创意共享千万数据集 (YFCC100M),其包含约 1 亿个多媒体对象,其中约 99.2 万个为照片,0.8 万个为视频,所有对象均带有创意共享许可证。该数据集提供了详细的元数据信息和从 2004 年到 20
→
PDF
9 years ago
Prev
Next