BriefGPT.xyz
Ask
alpha
关键词
attention-based fusion
搜索结果 - 4
跳跃注意力的单目深度预测
通过引入基于注意力机制的 Skip Attention Module,使得 Monocular Depth Estimation 的编码器和解码器特征更好地融合;并将问题表述为一个像素查询细化问题,利用提出的 Bin Center Pred
→
PDF
2 years ago
ECCV
TAFIM:针对面部图像篡改的定向对抗攻击
本文提出了一种新的数据驱动方法,通过将保护图像嵌入原始图像来防止面部操纵,生成的扰动对常见图像压缩具有鲁棒性,同时引入关注度融合机制,从而提高保护效果。
PDF
3 years ago
FusionPainting: 多模态融合的自适应注意力应用于 3D 物体检测
提出了一个称为 “FusionPainting” 的多模态融合框架,它可以在语义级别上融合 2D RGB 图像和 3D 点云以提高 3D 障碍物检测性能,并在 nuScenes 检测基准测试中显示出优于其他现有方法的性能。
PDF
3 years ago
面向对话语音标点预测的多模态半监督学习框架
本研究探索一种多模态半监督学习方法,通过学习大量无标签的音频和文本数据来预测标点符号。实验结果表明,使用注意力机制的多模态融合相对于使用强制对齐的多模态融合可以使基线模型分别在参考转录和自动语音识别输出上达到约 6-9%和 3-4%的绝对改
→
PDF
4 years ago
Prev
Next