- ICCV 2023 年第 1 届感知测试挑战赛时间声音定位任务的解决方案
本研究提出了一种改进时态音频定位质量的解决方案,采用多模态融合方法结合视觉和音频特征。通过使用先进的自监督预训练网络提取高质量的视觉特征,得到高效的视频特征表示。同时,音频特征作为补充信息帮助模型更好地定位声音的起始和结束。融合的特征在多尺 - 通过不确定性特征融合和智能距离聚合提升人员再识别
本研究提出了一种新的方法,通过将不确定性特征融合(UFFM)与智能距离聚合(WDA)相结合,显著提升了人物再识别(Re-ID)的准确性,通过在市场 - 1501、DukeMTMC-ReID 和 MSMT17 等基准数据集上进行测试,在 Ra - 利用 Defilters 克服野外环境中目标检测的场景背景限制
通过采用图像去滤波器来纠正图像失真问题,本文的研究重点是改进目标检测的性能。实验证明,在非失真图像上训练目标检测模型显著提高了均值平均精度,从而为受图像失真困扰的真实应用程序提供相当大的好处。
- ICLR特征丢弃时的边界框稳定性反映了检测器在不同环境下的泛化能力
通过对边界框的稳定性进行评估,可以预测目标检测的准确性,从而在没有测试真值的情况下提高检测器的泛化能力。
- 机器生成文本本地化
该研究旨在识别机器生成的文本并对文档中的机器生成部分进行定位,以避免由于对部分新闻文章的机器生成篡改而导致整个文档的误导。通过利用上下文信息,该方法能够在多个句子同时预测其是否为机器生成,从而提高了性能。与之前的研究相比,该方法在 Good - 利用分段任意模型 (SAM) 的多光谱自动转移技术 (MATT) 进行机器驱动的图像标注
本文介绍了一种名为多光谱自动转换技术(MATT)的方法,通过将 Segment Anything Model(SAM)从 RGB 图像中的分割掩模转置,实现对多光谱图像进行高精度和高效率的分割和标记,从而在训练多光谱模型时节省时间并降低少量 - MeanAP 引导的增强式主动学习用于目标检测
该论文介绍了一种使用任务模型的 MeanAP 指标设计采样策略的新方法,即 MeanAP-Guided Reinforced Active Learning for Object Detection(MAGRAL),通过强化学习的采样代理基 - 探索用于提升集成强健性的模型学习异质性
通过形式分析和实证评估,本文展示了异构深度集成模型可以通过高集成多样性有效地利用模型学习的异质性以提高集成的鲁棒性。
- 可学习间距的扩张卷积音频分类
在这篇论文中,通过使用 DCLS 方法替代卷积架构中的 DSC 层,显著提高了音频标记的平均精度,同时不增加参数数量,并且对吞吐量只有较低的成本。
- 检测、增强、组合和适应:目标检测中的四个无监督领域适应步骤
无监督领域自适应在目标检测中发挥重要作用,该论文提出了一种新颖而有效的四步骤无监督领域自适应方法,利用自我监督学习同时训练源数据和目标数据,并在目标图像中识别具有最高置信度的检测区域作为伪标签,通过广泛实验,取得了领先竞争对手超过 2% m - ICCV物体不消失:通过单帧物体位置预测的视频物体检测
通过利用连续平滑的运动,我们在三个方面进行了改进:1)通过将对象运动作为额外的监督来源,从静态关键帧中预测对象位置来提高准确性。2)通过仅在少量帧中进行昂贵的特征计算来提高效率。3)通过仅注释关键帧并利用关键帧之间的平滑伪运动来减少注释成本 - ICCVFireFly 野火中的仿生数据集
用火花检测为主题的合成数据集 FireFly,使用 Unreal Engine 4 生成,旨在克服现有合成资源的缺乏。研究生成了 19,273 帧数据,用于评估 FireFly 在四种常见目标检测模型上的性能,通过半自动标注过程,并在现实野 - 模型是否理解文档?针对文档级关系抽取进行语言理解模型基准测试
本文研究了文档级别关系抽取中模型对关系预测的决策规则,从注释、实验等多个角度评估了当前 SOTA 模型和人类在关系抽取方面的差异,并提出了平均精度均值(MAP)作为综合评估指标,结果提示 未来关系抽取模型的评估应考虑性能和理解能力两个方面。
- 使用 IoGT 和距离度量方法提高自动驾驶中 3D 物体检测器的安全性
通过结合 IoGT 指标和距离比率,该论文提出了一种直接的安全度量,特别适用于自动驾驶场景下的三维物体检测器,并将 IoGT 改进为常用精度导向的损失函数,实验证明使用该损失函数训练的目标检测器显著降低了不安全预测率,同时保持良好性能和稳定 - 计算平均精度的并行实现
通过使用广播,掩码和索引,我们提出了一种并行化的方法来处理检测到的边界框和真实值边界框,以计算平均精度,并且我们的实现是基于 PyTorch 和 TensorFlow 的,因此更快,更容易适应典型的训练例程。
- ECCV精确物体检测的量子软 QUBO 抑制
本文提出了基于量子计算优势的 Quantum-soft QUBO Suppression (QSQS) 算法,应用于物体检测中的冗余检测。 实验证明,相比于传统的 NMS 和 soft-NMS 算法,该算法将 PASCAL VOC 2007 - ECCV可解释的前景物体搜索作为知识蒸馏
该论文提出了一种基于知识蒸馏的前景物体搜索(FoS)方法,它能够在同一类别的前景中进行 “可替换前景” 的实例级搜索,并且超越了先前的最优结果。
- CVPR基于 Mask-RCNN 的概率目标检测基准线
本文主要介绍使用新的评估指标(PDQ)和一个新的合成图像数据集评估目标检测方法的概率目标检测挑战。作者使用了经过微调的 Mask-RCNN 以及一些额外的后处理方法,最终在排行榜中得到了第二名的成绩,并且获得了最高的空间质量和平均检测质量, - 用平均精度学习:使用整体损失来训练图像检索
本研究借助最近的榜单损失函数理论和实践证明,通过直接优化全局平均精度,提出了一个图像检索模型,消除了现有模型所需的工程努力和基于工具性方法的需求,并在许多标准检索基准测试中建立了新的基准。
- CVPR通过渐进式域自适应进行跨领域弱监督物体检测
本文提出了一种跨域弱监督目标检测的框架,通过对源领域上有实例级别注释的图像和目标领域上仅有图像级别注释的图像进行双重领域适应技术进行微调,取得了 5 到 20 个百分点的均值平均精度改进。