- SiamTHN: 用于视觉跟踪的连体目标高亮网络
本文提出了一种基于孪生网络的目标跟踪方法,其中引入了目标强调模块来提高相似性响应映射的目标区域的聚焦能力,同时使用校正损失来训练模型以减少分类和回归之间的不匹配,实验表明该方法优于当前模型在性能上表现,同时效率达到 38 fps。
- 元学习连体网络用于少样本文本分类
本文提出了一种 Meta-Learning Siamese Network 来解决 few-shot learning 中的三个主要问题(即原型向量计算中忽略采样的随机性,忽略标记样本的重要性和纯随机构建元任务)。与现有模型相比,Meta- - SARAS-Net:尺度和关系感知孪生网络用于变化检测
本文提出了一个名为 SARAS-Net 的新型深度学习模型,结合了关系感知、尺度感知和交叉转换器三个模块,以更好地解决场景变化检测中存在的空间信息、尺度改变和交互信息等问题,并在多个公共数据集上取得了 State-of-the-Art 准确 - 通过三维等变性实现自监督的宽基线视觉伺服
本篇论文提出了一种新的自监督视觉伺服方法,用于基于宽基线图像的相机姿态估计,并以前沿的 3D 引导方法相比在 YCB 数据集上表现出了显着的性能提升。
- 通过弱监督重新利用知识图谱嵌入进行三元组表示
本文提出了一种基于预训练知识图谱嵌入的三元组表示微调方法,利用 Siamese 网络训练,从而在三元组分类和聚类任务中实现了与其他最新技术相比的一致性改进。
- ECCV3D Siamese Transformer 网络用于基于点云的单目标跟踪
本文使用 Siamese Transformer 网络,结合点云的形态信息和深度信息,在 3D 单目标跟踪任务中实现了鲁棒的交叉相关学习,取得了与 KITTI、nuScenes 和 Waymo 数据集上最优的表现。
- 掩蔽连体卷积网络
本文研究掩蔽 Siamese 网络在卷积神经网络下的问题,并提出多个经验设计来逐渐解决这些问题。该方法在低样本图像分类上表现有竞争力,并在目标检测基准测试中优于以前的方法。
- CVPR基于全交叉变换器的小样本目标检测
本文提出了一种新的基于 Fully Cross-Transformer 的模型 (FCT) 实现 few-shot 目标检测,通过在特征 backbone 和检测头中结合跨模块交互 attention,提高模型中不同表示层之间的相似性学习以 - 基于双重相关性减少的深度图聚类
提出了一种名为 Dual Correlation Reduction Network(DCRN)的方法,该方法采用双重相关性降低的策略来减少节点编码过程中的表征崩溃现象,同时通过 GCN 中引入传播正则化项来缓解过度平滑造成的表征崩溃现象, - 交互式 Transformer 连体网络用于视频目标分割
本文提出了一种基于双模型网络和交互式变换器的半监督视频对象分割方法,能够有效地从历史帧向当前帧传播上下文信息,同时使用特征交互模块,提高了目标表示的性能,并通过三种基准实验验证了其优于现有方法的性能.
- 通过估计双类分布进行自监督学习
TWIST 是一种基于自我监督学习的表示学习方法,采用孪生网络和 softmax 操作来进行大规模无标签数据集的分类,并提出了一种最大化输入与类别预测之间的互信息、最小化每个样本分布熵和最大化平均分布熵的方法,从而避免了输出相同类别概率分布 - EMNLP从无到严重:预测电影剧本中的严重度
该研究采用孪生神经网络多任务框架,通过对电影的对话脚本进行分析,在性、暴力、亵渎、药物、惊悚场景五个方面预测电影内容的严重程度。结果表明该方法超越了现有的最先进模型并提供了有用的预测信息。
- IJCAISiamRCR:针对视觉目标跟踪的互惠分类和回归
本文提出了一种名为 SiamRCR 的新型同孪网络追踪算法,建立了分类和回归分支之间的相互关联,通过添加定位分支来解决分类和回归不准确之间的问题,证明其在多个实验结果上具有优越性。
- 视觉类比:深度学习与组合模型
本论文比较了人类视觉类比问题解决能力和三种不同的计算模型的性能,包括成分模型、连体网络和关系网络,结果显示成分模型的定性表现与人类推理者相似,而深度学习模型的表现则不如人类。
- 应用迁移学习提升特定领域搜索体验:使用查询和问题的相似度
本研究提出一种针对任何特定领域搜索引擎的框架来计算给定输入查询和一组预定义问题之间的相似度,使用 Siamese 网络和 LSTM 模型训练分类器来生成未归一化和归一化的相似度分数,并结合两种词向量和自定义模糊匹配分数等三种其他相似度得分计 - 用于高速空中追踪的连锁锚点建议网络
该研究提出了一种新的基于 Siamese 网络的两阶段方法,即第一阶段用于高质量锚点提取,第二阶段用于锚点的细化优化,从而实现了对小物体、遮挡物和快速移动物体的自适应锚点生成,大大降低了计算量,在三个基准测试中获得了更优秀的表现,并取得了大 - AAAICo-mining:稀疏标注目标检测的自监督学习
本文提出了一个名为 Co-mining 的机制,它使用 Siamese 网络进行多视角学习和更好地挖掘未标注实例,从而用于大多数现代物体检测器的一般训练机制,该机制在 MS COCO 数据集上进行了实验,通过在 RetinaNet 上应用 - MM使用深度共享网络进行不同化脸部检测
本文提出了一种新的差分变形攻击检测框架,使用深度 Siamese 网络,通过比较我们的模型与其他经典和深度学习模型,使用两个不同的变形数据集,VISAPP17 和 MorGAN,我们探索了由对比损失生成的嵌入空间,并使用欧几里得距离、特征差 - CVPR用于立体图像超分辨率的对称视差注意力
本研究提出了一种利用双目系统对称性线索优化立体图像超分辨率的方法,设计了一个 Siamese 网络和一个对称双向视差注意模块 (biPAM),并使用几种抗光度损失增强立体一致性,实验结果表明我们的方法性能优越。
- 视觉目标跟踪的高效对抗攻击
本文分析了基于 Siamese 网络的物体跟踪器的脆弱性,提出了一种名为 FAN 的端到端网络,使用漂移损失和嵌入特征损失来攻击 Siamese 网络跟踪器,并在单个 GPU 上具有高效的训练速度和强大的攻击性能,可以在 10 毫秒内生成对