多模态数据筛选与整理：基于目标检测和过滤器集成

ICCVJan, 2024

多模态数据筛选与整理：基于目标检测和过滤器集成

Multimodal Data Curation via Object Detection and Filter Ensembles

Tzu-Heng Huang, Changho Shin, Sui Jiet Tay, Dyah Adila, Frederic Sala

TL;DR我们提出了一种用于 2023 年 DataComp 竞赛过滤轨道的多模态数据筛选方法，该方法将目标检测和基于弱监督的集成相结合，使性能提升了 4%，并在小规模轨道中取得了排名第一的位置，并且通过集成现有基准和弱监督方法在中等规模轨道上实现了 4.2% 的改进。

Abstract

We propose an approach for curating multimodal data that we used for our entry in the 2023 DataComp competition filtering track. Our technique combines object detection and →

curating multimodal data object detection weak supervision ensembled filtering rules performance improvement

发现论文，激发创造

基于弱监督学习的多证据过滤与融合方法用于多标签分类、目标检测和语义分割

该论文提出了一种弱监督课程学习流程，用于多标签对象识别、检测和语义分割的任务，其中包括四个阶段，包括训练图像的对象定位、筛选和融合对象实例、像素标注以及基于任务的网络训练，通过这种流程，实现了在 MS-COCO、PASCAL VOC 2007 和 PASCAL VOC 2012 数据集上进行多标签图像分类以及弱监督对象检测和语义分割的最新成果。

Feb, 2018

使用数据增强的 Deep CNN 集成物体检测模型

采用 DeepEnsembleCoco 的方法，利用 R-CNN 模型与深度 CNN 模型的集成来实现在目标检测方面取得最新的成果，并且在 PASCAL VOC 2012 比赛中的表现已超过以往所有的方法。

Jun, 2015

目标检测与少数类共识关注

使用修改的共识焦点和基于源置信度的投票系统，该研究提出了一种半监督和长尾目标检测方法，通过在目标标签空间中选择各个类别的相关性，放宽了少数类别边界框的抑制，从而比 NMS、soft-NMS 和 WBF 等方法获得更高的置信度和更准确的边界框。

Jan, 2024

通过有选择的自监督自训练来改进物体检测

本文介绍了一种使用网络图像来扩充人为筛选的物体检测数据集的方法，通过图像匹配来检索网络图像，提出了一种新的学习方法，以获取正和负的边界框的监督信号，从而提高了检测结果。

Jul, 2020

通过概率集成进行多模态物体检测

探讨如何使用 RGB 和热成像相机实现多模态目标检测，并提出了一种概率集成技术 ——ProbEn, 该方法基于贝叶斯定理和条件独立性假设，即使条件独立性假设不成立，ProbEn 也能明显改善多模态检测，并在两个基准测试中取得了超过 13% 的相对性能提升。

Apr, 2021

更快、更轻、更准确：用于内容审核的深度学习集成

基于简化的视觉特征，我们提出了一个高效且轻量级的深度分类集成结构，以解决对高准确率分类具有低误报的暴力内容的需求。通过使用一组轻量级模型进行颜色特征的缩减，并应用于图像和视频，我们评估了该方法并与常用的深度学习模型进行了比较，结果显示了预测准确率的显著提高，同时推广了快速推理和较低的计算成本。虽然我们的方法针对爆炸检测，但也可应用于其他类似的内容管理和暴力检测用例。基于我们的实验，我们提出了 “小思考，多思考” 的分类策略，认为将单一的大型深度模型转化为多个小型、简单且轻量级模型的验证式步骤模型集成可能导致更高准确率的预测。

Sep, 2023

基于数据不确定性引导的半监督目标检测多阶段学习

本文提出了基于数据不确定性引导的多阶段学习方法和图像不确定性引导简单数据选择和感兴趣区域重新加权方法，能够充分考虑不同类型的未标记图像并将不同阶段的模型集成在一起，从而使半监督目标检测器更加聚焦于更可靠的知识，实验结果表明，该方法与基线方法相比具有显著的优势。

Mar, 2021

使用不确定性的信息数据选择在多模式物体检测中

本研究提出了一种基于深度学习的通用不确定性感知多模态融合模型，该模型采用多管道宽松耦合架构将点云和图像特征进行组合，并将不确定性嵌入在边界框生成中，以生成可靠的输出，在 KITTI 2D 物体检测数据集和其衍生的 “脏数据” 中得到了验证。

Apr, 2023

基于元学习的跨模态提示的多模态小样本目标检测

本文介绍了一种基于多模态少样本学习的目标检测方法，使用视觉样本和分类语义信息来检测目标，通过元学习和提示学习相结合，在不需要微调的情况下建立通用少 / 零样本检测模型，同时引入知识蒸馏来解决针对稀有类别缺乏类名称先验知识的问题，通过在多个少样本数据集上的实验来验证该方法的有效性。

Apr, 2022

使用大量异构神经网络进行标签去噪

该研究讨论了使用知识蒸馏和混合技术的集成模型的方法，以解决大规模视频分类问题。

Sep, 2018