利用自主学习提升历史文档中文本行检测（有标签缺失情况下）

ECCVJan, 2022

利用自主学习提升历史文档中文本行检测（有标签缺失情况下）

Self-paced learning to improve text row detection in historical documents with missing labels

Mihaela Gaman, Lida Ghadamiyan, Radu Tudor Ionescu, Marius Popescu

TL;DR该研究提出了一种自学习算法来提高光学字符识别系统中的文本行检测性能，利用自学习策略逐渐添加缺失标注的训练例子，通过将真实的边界框与伪边界框进行非极大值抑制的组合，在历史文档的两个数据集上显著提高了 YOLOv4 的平均精度。

Abstract

An important preliminary step of optical character recognition systems is the detection of text rows. To address this task in the context of historical data with missing labels, we propose a →

optical character recognition text rows self-paced learning ground-truth bounding boxes historical documents

发现论文，激发创造

自主学习深度学习技术在弱监督目标检测中的应用

本文基于自适应学习的思想，针对目前对象检测的弱监督情况，提出了一种基于深度神经网络架构的自适应学习策略，并在 Pascal VOC 2007、Pascal VOC 2010 和 ILSVRC 2013 数据集上得到了最先进的实验结果。

May, 2016

面向具有噪声标注的抗噪声目标检测

本文提出了一种训练目标检测器的框架，该框架可以处理含有混合标签噪声和边界框噪声的嘈杂标注数据，并通过交替噪声校正和模型训练来共同优化目标标签、边界框坐标和模型参数，其方法通过执行两个步骤来分离标签噪声和边界框噪声，并在 PASCAL VOC 和 MS-COCO 数据集上获得了良好的实验效果。

Mar, 2020

带伪边界框标签的开放词汇目标检测

本研究提出一种方法，从大规模图像 - 字幕对中自动生成多样物体的伪包围框注释，以扩大训练基础类别的范围，并通过实验证明该方法在各种数据集上比最先进的开放词汇检测器有更好的检测结果。

Nov, 2021

物体检测数据集中的噪声标签处理

该研究探讨了利用自信学习算法来改善训练数据集的质量，通过发现原始训练数据集中的错误标签，可以消除其根源上的错误样本并重新标注可疑的边界框来提高数据集的质量，最终提高目标检测算法的性能。

Nov, 2022

室内场景目标检测的更快边界框标注

本文提出了一种快速边界框注释的方法，该方法分为两个阶段：第一步手动标注数据集的一部分，第二步采用第一阶段注释的模型对其余样本进行注释。我们还介绍了一个新的完全标记的室内场景物体检测数据集，使用几种最先进的模型对其训练，并在速度和准确性方面进行了比较。

Jul, 2018

半监督自修正语义图像分割网络

本研究介绍了一种半监督框架，通过一个辅助模型和一个自我纠正模块，在只有一小部分完全有监督图像的基础上，使用具有目标边界框标签的图像和只有目标边界框标签的图像集（称为弱集），训练出高质量的语义分割模型，这种方法比传统大量完全有监督数据模型要求的标注工作量减少～7 倍。

Nov, 2018

不需要边界框：仅使用人工验证来训练物体类别检测器

通过提出一种仅需要验证自动产生的边界框的方案来训练目标类检测器，这种方案可以通过反复训练检测器、在训练图像中重新定位对象并进行人类验证，从而使用验证信号来改善重新训练和减少重新定位的搜索空间。实验表明，采用人类验证更新检测器和减少搜索空间可以迅速产生高质量的边界框注释，而且与完全监督的检测器相比，可以在不绘制任何边界框的情况下提供几乎同样好的性能。

Feb, 2016

面向 OCR 后校正的词汇感知半监督学习

该论文介绍了一种利用 OCR 生产的非数字化的图书和文件实现半监督学习的方法，并通过使用自我训练和词汇解码等技术在四种濒危语言上提高了 OCR 的相对准确率。

Nov, 2021

利用边界框标注实现低成本细胞图像分割的主动学习

我们提出了一种使用边界框注释的主动学习框架，用于细胞分割，大大降低了数据注释成本。通过将 YOLOv8 检测器与 Segment Anything Model (SAM) 相结合，我们生成了一个箱子监督学习方法（称为 YOLO-SAM），有效降低了数据注释的复杂性。此外，它还集成到一个主动学习框架中，使用 MC DropBlock 方法以较少的框注释样本来训练分割模型。广泛的实验证明，与遮罩监督深度学习方法相比，我们的模型节省了超过 90％的数据注释时间。

May, 2024

自训练方式提升语义分割

本文提出了一种半监督学习的方法，即自我训练范式，通过用标注数据训练教师模型并在大量未标注数据上生成伪标签，以较少的监督实现像素级准确模型，并在 Cityscapes，CamVid 和 KITTI 数据集上取得了最优表现，同时，在具有挑战性的跨域泛化任务上表现更佳，最后，为了减轻大量伪标签带来的计算负担，提出了一种快速训练计划来加速分割模型的训练。

Apr, 2020