多模态数据筛选与整理:基于目标检测和过滤器集成
该论文提出了一种弱监督课程学习流程,用于多标签对象识别、检测和语义分割的任务,其中包括四个阶段,包括训练图像的对象定位、筛选和融合对象实例、像素标注以及基于任务的网络训练,通过这种流程,实现了在 MS-COCO、PASCAL VOC 2007 和 PASCAL VOC 2012 数据集上进行多标签图像分类以及弱监督对象检测和语义分割的最新成果。
Feb, 2018
采用 DeepEnsembleCoco 的方法,利用 R-CNN 模型与深度 CNN 模型的集成来实现在目标检测方面取得最新的成果,并且在 PASCAL VOC 2012 比赛中的表现已超过以往所有的方法。
Jun, 2015
使用修改的共识焦点和基于源置信度的投票系统,该研究提出了一种半监督和长尾目标检测方法,通过在目标标签空间中选择各个类别的相关性,放宽了少数类别边界框的抑制,从而比 NMS、soft-NMS 和 WBF 等方法获得更高的置信度和更准确的边界框。
Jan, 2024
本文介绍了一种使用网络图像来扩充人为筛选的物体检测数据集的方法,通过图像匹配来检索网络图像,提出了一种新的学习方法,以获取正和负的边界框的监督信号,从而提高了检测结果。
Jul, 2020
探讨如何使用 RGB 和热成像相机实现多模态目标检测,并提出了一种概率集成技术 ——ProbEn, 该方法基于贝叶斯定理和条件独立性假设,即使条件独立性假设不成立,ProbEn 也能明显改善多模态检测,并在两个基准测试中取得了超过 13% 的相对性能提升。
Apr, 2021
基于简化的视觉特征,我们提出了一个高效且轻量级的深度分类集成结构,以解决对高准确率分类具有低误报的暴力内容的需求。通过使用一组轻量级模型进行颜色特征的缩减,并应用于图像和视频,我们评估了该方法并与常用的深度学习模型进行了比较,结果显示了预测准确率的显著提高,同时推广了快速推理和较低的计算成本。虽然我们的方法针对爆炸检测,但也可应用于其他类似的内容管理和暴力检测用例。基于我们的实验,我们提出了 “小思考,多思考” 的分类策略,认为将单一的大型深度模型转化为多个小型、简单且轻量级模型的验证式步骤模型集成可能导致更高准确率的预测。
Sep, 2023
本文提出了基于数据不确定性引导的多阶段学习方法和图像不确定性引导简单数据选择和感兴趣区域重新加权方法,能够充分考虑不同类型的未标记图像并将不同阶段的模型集成在一起,从而使半监督目标检测器更加聚焦于更可靠的知识,实验结果表明,该方法与基线方法相比具有显著的优势。
Mar, 2021
本研究提出了一种基于深度学习的通用不确定性感知多模态融合模型,该模型采用多管道宽松耦合架构将点云和图像特征进行组合,并将不确定性嵌入在边界框生成中,以生成可靠的输出,在 KITTI 2D 物体检测数据集和其衍生的 “脏数据” 中得到了验证。
Apr, 2023
本文介绍了一种基于多模态少样本学习的目标检测方法,使用视觉样本和分类语义信息来检测目标,通过元学习和提示学习相结合,在不需要微调的情况下建立通用少 / 零样本检测模型,同时引入知识蒸馏来解决针对稀有类别缺乏类名称先验知识的问题,通过在多个少样本数据集上的实验来验证该方法的有效性。
Apr, 2022