- 通過野生動物再識別增強理解能力
我们通过使用 NumPy 从头实现 MLP,使用 Keras 进行 DCNN,以及使用 LightGBM 进行二元分类器,探索了野生动物重新识别领域,并分析了多模型在多数据集上的性能表现。
- 基于 CLIP 的交互式图像检索中的相关性反馈再审
通过集成 CLIP 与经典的相关反馈技术以增强图像检索,我们提出了一种交互式基于 CLIP 的图像检索系统,并利用相关反馈收集用户独特的偏好,从而适应不同用户的偏好并实现高准确性的图像检索。
- 通过困难负例采样理解双曲度量学习
最近几年,将双曲几何方法融入计算机视觉领域的趋势日益增长。本研究调查了将双曲空间整合到度量学习中的效果,特别是在使用对比损失进行训练时。我们通过深入研究评估了使用混合目标函数的视觉变换器 (ViTs) 结果来解决现有文献中关于对比损失温度影 - 音视频检索的锚点感知深度度量学习
提出了一种创新的 Anchor-aware Deep Metric Learning (AADML) 方法,通过揭示现有数据点之间的潜在相关性来提高共享嵌入空间的质量,并在两个音频 - 视觉基准数据集上的广泛实验证明了该方法的有效性,显著超 - 上下文感知孪生网络在会话中高效的情感识别
通过深度学习模型,本研究提出了一种基于度量学习和 Siamese 网络架构的方法来进行情感识别对话任务,取得了 57.71 的宏 F1 得分,相较于相关研究有了显著的提升。
- 有限配对偏好比较的度量学习
度量学习、偏好比较、理想点模型、马氏距离、低维结构
- 基于空间级联聚类和加权记忆的无监督人员再识别
最近的无监督人员再识别(re-ID)方法通过利用细粒度的局部上下文实现了较高的性能。然而,大多数基于部分的方法通过水平分割来获得局部上下文,由于各种人体姿势导致了配准的问题。此外,部分特征中语义信息的不配准限制了度量学习的使用,从而影响了基 - 简单却行之有效:重新思考 fNIRS 在排除异常输入中的深度学习能力
用非侵入性技术的功能性近红外光谱(fNIRS)监测脑活动。通过使用深度学习解决 fNIRS 数据的分类挑战,研究表明当前 fNIRS 网络在准确预测其训练分布内的数据方面效果显著,但对于识别并排除分布之外的异常数据则表现不佳,影响可靠性。我 - 基于对比学习的少样本动作识别的双流联合匹配方法
基于对比学习的双流联合匹配 (TSJM) 方法在少样本动作识别中解决了动作关系建模、多模态信息利用不足、不同长度和速度的视频匹配问题,以及视频子动作不对齐的匹配问题。
- 视网膜中的信号处理:可解释的图分类器预测神经节细胞响应
从数据中学习可解释的基于图的分类器以预测视觉刺激下的节细胞发射;通过学习正半定 (PSD) 距离矩阵来定义图节点 (视觉事件) 之间的马氏距离,从而导出边权和可进行二元分类的组合图;通过图的半定规划来优化距离矩阵的目标,结合 Gershgo - ICCV错位,对比,提炼:再思语言 - 图像预训练中的错位问题
提出了一种新的度量学习方法 ——Misalign, Contrast then Distill (MCD),该方法利用图像和文本之间的错位作为额外的训练来源,通过预测增强图像和文本之间的连续错位程度,达到了多个分类和检索数据集中最先进的迁移 - 使用 3D CT 的剩余三元卷积神经网络增强轻度脑损伤诊断
使用三维计算机断层扫描图像和基于度量学习技术的残余三元组卷积神经网络模型提高轻度创伤性脑损伤(mTBI)的诊断,通过嵌入特征空间将 CT 扫描者区分为 mTBI 病例和正常者,并实现 94.3% 的平均准确率、94.1% 的灵敏度和 95. - Shadow:用于孪生网络高效训练的新型损失函数
提出了一种名为 Shadow Loss 的新型损失函数,通过在损失计算期间压缩嵌入空间的维度,从而在不损失性能的情况下克服了现有方法在内存限制下面临的挑战。该损失函数通过在紧凑投影空间上从输入中学习嵌入的投影之间的距离,这些距离直接对应于类 - EMNLP自适应端到端度量学习用于零样本跨领域槽填充
基于深度学习和大规模标注数据,本论文提出了一种适应性的端到端度量学习方案,用于解决零样本槽填充的挑战性问题,并通过级联式联合学习框架、上下文感知软标签表示和槽级对比表示学习方法,有效地缓解了数据和标签转移问题,实验证明了该方法优于其他竞争基 - Hyp-UML: 超几何图像检索与不确定性感知度量学习
我们提出了一种基于双曲空间的带不确定性度量学习的图像嵌入算法,通过广泛的实验验证了该算法在相关方法中达到了最新的成果,并通过全面的剖析研究验证了提出算法的每个组成部分的有效性。
- FreeReg: 集成预训练扩散模型和单目深度估计的图像到点云注册
图像与点云之间的特征匹配问题是图像到点云配准的基本问题。通过预训练的大规模模型来统一图像和点云之间的模态,并在同一模态内建立可靠的对应关系。我们利用深度到图像扩散模型提取的中间特征即扩散特征在图像和点云之间具有语义一致性,这使得粗糙但稳健的 - 商标识别的图像 - 文本预训练
使用图像 - 文本配对样本进行预训练并改进度量学习损失函数来提高开放式标志识别的匹配模型的性能。将相同的图像 - 文本预训练模型微调到公共标志数据集上,显著提高了性能,并且在五个公共标志数据集上取得了新的最新成果。
- 具有参数高效迁移学习的通用度量学习
我们引入了一种名为通用度量学习(UML)的新型度量学习范式,它能够学习到能够捕捉多个数据分布关系的统一距离度量。通过使用预训练模型和两个额外的模块,即随机适配器和提示池,我们提出了一种名为参数高效通用度量学习(PUMA)的方法来解决不平衡数 - 内在维度对于压缩下度量学习的影响
在高维背景下,本文通过对数据的随机压缩版本进行训练和全秩度量,在距离度量学习的错误方面提供了理论保证,这不依赖于环境维度,同时假定数据来自有界支持并自动在存在良好几何结构时收缩。合成和真实数据集的实验结果支持我们在高维背景下的理论发现。
- 感知调整查询和逆测量范式用于低秩度度量学习
引入一种新的查询机制,称为感知调整查询(PAQ),用于收集人类反馈,通过在度量学习问题中应用 PAQ,学习未知的马哈拉诺比斯距离,产生了一个高维低秩矩阵估计问题,以及为此估计器提供样本复杂度保证