使用深度强化学习进行弱监督场景文本检测
本文提出了一种弱监督场景文本检测方法(WeText),通过学习未注释或弱注释数据来训练强大的准确的场景文本检测模型,充分利用少量全注释数据集训练的监督模型,探索将半监督和弱监督学习应用于大型未注释数据集和大型弱注释数据集。该方法能够显著提高场景文本检测性能,在仅使用 229 个完全标注的场景文本图像的情况下,弱监督学习仍能够实现最先进的性能。
Oct, 2017
本文提出了一种基于弱监督学习的场景文本生成方法,通过跨语言生成,将场景文本图片的内容和样式特征分离,并引入整合式注意力模块和预先训练的字体分类器以保证生成图片的完整内容结构以及填补不同语言文本风格之间的差距,实验结果显示,该方法显著提高了场景文本识别精度。
Jun, 2023
本研究提出了一种基于弱监督的虚假新闻检测框架 WeFEND,该框架利用用户举报作为弱监督来扩大数据集规模。我们采用增强学习方法,从弱标注数据中选择高质量样本来提高检测器的精度。实验结果表明,与现有技术相比,WeFEND 模型在微信公众号新闻数据集上实现了最优性能的虚假新闻检测。
Dec, 2019
提出了一种基于弱监督分层强化学习框架的视频摘要算法,该算法将任务分解为多个子任务,通过训练管理器网络为每个子任务设置子目标,在此基础上使用策略梯度预测视频帧的重要性得分,通过定义的子奖励和全局奖励来解决稀疏问题,并在两个基准数据集上实验证明其具有最佳性能。
Jan, 2020
该研究提出了一种半监督学习方法,利用一个 “目标网络” 和一个 “置信网络” 进行多任务训练,在大量弱注释未标注数据上优化目标网络,同时用置信网络的分数来加权目标网络的梯度更新,以避免噪声标签对目标网络模型的质量造成损害,并在评估中证明其相对基线的性能得到提高,同时从弱标签中提高了学习速度。
Nov, 2017
研究了在没有任何标注数据的情况下,通过多种易于提供的规则作为多种弱监督源,学习神经文本分类器的问题,提出了一种标签降噪器,它使用条件软注意机制估计源的可靠性,然后通过聚合注释的弱标签降低标签噪声,然后使用这些清理过的伪标签来训练神经分类器。在情感,主题和关系分类的五个基准测试上进行了评估,结果表明,该模型始终优于最先进的弱监督和半监督方法,并且即使没有任何标注数据,也可以达到与全监督方法相当的性能水平。
Oct, 2020
本文提出了一种弱监督文本分类方法,其包括一个利用种子信息生成伪标签文档进行模型预训练的伪文档生成器和一个在真实未标记数据上引导模型改进的自训练模块,具有处理不同类型弱监督任务和易于与深度神经网络模型集成等优点,并在三个真实数据集上进行了广泛的实验,结果表明其大幅优于基准方法而不需要过多的训练数据。
Sep, 2018
本文介绍了一种使用弱监督来自动区分语义明确的任务子空间和无意义的 “杂草” 任务空间的方法。研究表明,这种学习到的子空间可实现高效探索,并提供了一种捕捉状态间距离的表示形式。该方法在多种具有挑战性的基于视觉的连续控制问题中实现了显著的性能提升,特别是在环境复杂性增加的情况下。
Apr, 2020