使用深度强化学习进行弱监督场景文本检测

Jan, 2022

使用深度强化学习进行弱监督场景文本检测

Weakly Supervised Scene Text Detection using Deep Reinforcement Learning

Emanuel Metzenthin, Christian Bartz, Christoph Meinel

TL;DR本文提出了一个基于弱监督和增强学习的场景文本检测方法，使用神经网络估计强化学习智能体的奖励值，且在真实数据和合成数据相结合的半监督学习中表现最佳。

Abstract

The challenging field of scene text detection requires complex data annotation, which is time-consuming and expensive. Techniques, such as weak supervision, can reduce the amount of data needed. In this paper we propose a →

scene text detection weak supervision reinforcement learning semi-supervised training synthetic data

发现论文，激发创造

WeText: 弱监督下的场景文本检测

本文提出了一种弱监督场景文本检测方法（WeText），通过学习未注释或弱注释数据来训练强大的准确的场景文本检测模型，充分利用少量全注释数据集训练的监督模型，探索将半监督和弱监督学习应用于大型未注释数据集和大型弱注释数据集。该方法能够显著提高场景文本检测性能，在仅使用 229 个完全标注的场景文本图像的情况下，弱监督学习仍能够实现最先进的性能。

Oct, 2017

低资源语言的弱监督场景文本生成

本文提出了一种基于弱监督学习的场景文本生成方法，通过跨语言生成，将场景文本图片的内容和样式特征分离，并引入整合式注意力模块和预先训练的字体分类器以保证生成图片的完整内容结构以及填补不同语言文本风格之间的差距，实验结果显示，该方法显著提高了场景文本识别精度。

Jun, 2023

通过强化学习进行假新闻检测的弱监督方法

本研究提出了一种基于弱监督的虚假新闻检测框架 WeFEND，该框架利用用户举报作为弱监督来扩大数据集规模。我们采用增强学习方法，从弱标注数据中选择高质量样本来提高检测器的精度。实验结果表明，与现有技术相比，WeFEND 模型在微信公众号新闻数据集上实现了最优性能的虚假新闻检测。

Dec, 2019

层次强化学习实现弱监督视频摘要

提出了一种基于弱监督分层强化学习框架的视频摘要算法，该算法将任务分解为多个子任务，通过训练管理器网络为每个子任务设置子目标，在此基础上使用策略梯度预测视频帧的重要性得分，通过定义的子奖励和全局奖励来解决稀疏问题，并在两个基准数据集上实验证明其具有最佳性能。

Jan, 2020

控制性弱监督训练神经网络：避免重复导师的错误

该研究提出了一种半监督学习方法，利用一个 “目标网络” 和一个 “置信网络” 进行多任务训练，在大量弱注释未标注数据上优化目标网络，同时用置信网络的分数来加权目标网络的梯度更新，以避免噪声标签对目标网络模型的质量造成损害，并在评估中证明其相对基线的性能得到提高，同时从弱标签中提高了学习速度。

Nov, 2017

神经文本分类的去噪多源弱监督训练

研究了在没有任何标注数据的情况下，通过多种易于提供的规则作为多种弱监督源，学习神经文本分类器的问题，提出了一种标签降噪器，它使用条件软注意机制估计源的可靠性，然后通过聚合注释的弱标签降低标签噪声，然后使用这些清理过的伪标签来训练神经分类器。在情感，主题和关系分类的五个基准测试上进行了评估，结果表明，该模型始终优于最先进的弱监督和半监督方法，并且即使没有任何标注数据，也可以达到与全监督方法相当的性能水平。

Oct, 2020

弱监督神经文本分类

本文提出了一种弱监督文本分类方法，其包括一个利用种子信息生成伪标签文档进行模型预训练的伪文档生成器和一个在真实未标记数据上引导模型改进的自训练模块，具有处理不同类型弱监督任务和易于与深度神经网络模型集成等优点，并在三个真实数据集上进行了广泛的实验，结果表明其大幅优于基准方法而不需要过多的训练数据。

Sep, 2018

可控行为的弱监督强化学习

本文介绍了一种使用弱监督来自动区分语义明确的任务子空间和无意义的 “杂草” 任务空间的方法。研究表明，这种学习到的子空间可实现高效探索，并提供了一种捕捉状态间距离的表示形式。该方法在多种具有挑战性的基于视觉的连续控制问题中实现了显著的性能提升，特别是在环境复杂性增加的情况下。

Apr, 2020

弱监督自训练

本文提出一种基于弱监督、自训练、规则注意力网络和半监督学习的框架（ASTRA），利用所有可用数据来进行深度学习任务的训练，证明其在文本分类上有显著优势。

Apr, 2021

离线强化学习的半监督奖励学习

通过半监督学习算法，探索在人类奖励注释最小的约束下进行奖励学习，从而在缺少奖励函数的情况下培训机器人行为，并发现奖励模型的质量与最终策略之间的关系。

Dec, 2020