BriefGPT.xyz
Ask
alpha
关键词
video parsing
搜索结果 - 2
多模态平衡感知梯度调控弱监督音视频解析
本文提出了一种利用动态梯度调制机制来平衡不同语音和视觉模态特征学习的方法,并设计了一种实现精确测量的模态分离决策单元来处理多模式混淆问题, 实验证明该方法的有效性。
PDF
a year ago
ECCV
弱监督音视频解析联合模态标签去噪
本文旨在解决弱监督下视听视频解析任务中的异态噪声标签问题,并提出了一种标签清理的训练策略。通过将每个模态中每个实例的损失进行排序并根据损失的关系选择噪声样本,我们的方法在视觉指标方面取得了明显进展,从而表明我们的方法是有效的。
PDF
2 years ago
Prev
Next