BriefGPT.xyz
大模型
Ask
alpha
关键词
audio fusion
搜索结果 - 1
听我说:用混合方法增强音频时序动作定位
本文提出了简单而有效的基于融合的方法,首次同时考虑音频和视频模态用于监督式的未剪辑视频动作定位 (TAL),在多个融合方案、模态组合和 TAL 架构的消融试验中,我们通过大规模基准数据集(ActivityNet-1.3 和 THUMOS14
→
PDF
3 years ago
Prev
Next