- BERT-Flow-VAE:面向多标签文本分类的弱监督模型
本文提出了一种名为 BERT-Flow-VAE (BFV) 的弱监督多标签文本分类 (WSMLTC) 模型,通过使用种子主题模型和文本蕴含模型等方法,生成初步的主题 - 文档矩阵,并采用 VAE 框架重构嵌入,从而实现对全面标注数据需求的降 - ICLRH2RBox:水平框注释是实现方向目标检测所需的全部
本文提出了一种基于水平边界框注释的定向目标检测方法 H2RBox,利用弱监督和自监督学习进行训练,可以在复杂场景中更稳健地检测密集目标和离群值,并且与使用旋转框训练的方法在速度和性能方面相差无几。
- SoLar: Sinkhorn 标签提炼在不平衡偏标签学习中的应用
提出了基于最优传输的 SoLar 框架作为 PLL 问题的解决方案,该框架可用于弱监督情况下部分标签学习中的标签消岐,特别是在面对长尾分布和标签不完整情况下,该方法比先前的最新 PLL 方法表现出更高的性能。
- ECCV面向真实世界全景图像生成的弱监督拼接网络
提出了一种基于深度学习的缝合模型,采用弱监督学习机制训练,实现对多个鱼眼图像的 360 度输出,通过色彩一致性校正、畸变校正和图像融合实现,其训练采用感知损失和 SSIM 损失函数,在两个真实的缝合数据集上进行了有效性验证。
- 弱监督音视频来源定位的深入探究
本文提出了一种新的视听源定位方法,通过扩展音频图片嵌入的训练数据以及采用新的评估方法来解决定位不准确和过拟合的问题。
- AAAI基于涂鸦标注的弱监督伪装目标检测
本文提出了一种基于 scribble annotations 的弱监督 camouflaged object detection 方法,通过构建包括一致性损失和特征引导损失的模型以及引入两个新模块(LCC 模块和 LSR 模块),实现了结构 - ECCV基于层级原子动作的细粒度视频弱监督时序动作检测
本文提出一种弱监督的方法来检测细粒度视频动作,通过自我监督聚类获取可重复和自动发现的原子动作集合,并结合语义标签层次将原子动作映射到细粒度和粗粒度行动标签,最终构建了四个层次的视频可视化表示层次,在两个大型数据集上实验表明该方法在细粒度动作 - MM基于模态感知的对比实例学习与自监督蒸馏用于弱监督的音视频暴力检测
本文提出一种基于弱监督学习的音视频暴力检测方法,通过模态感知对比学习与自我蒸馏策略,有效地提高了音视频一致性,克服了多通道学习中的异质性问题,并在大规模 XD-Violence 数据集上达到更优的检测性能。
- KDD自适应多视角规则发现用于弱监督兼容产品预测
本文提出 AMRule,一种基于多视图规则发现的弱监督学习框架。通过决策树和预训练语言模型分别从结构化属性表和非结构化产品描述中生成高可组合性的高阶规则和基于提示的规则,从而适应性地发现标签规则,提高产品兼容性预测的准确性,实验结果表明 A - Box2Mask: 使用边界框进行弱监督的三维语义实例分割
本文提出 Box2Mask 方法,利用 3D 包围盒标签进行弱监督学习,通过 Hough 投票和聚类方法实现 3D 实例分割,无需密集注释点云数据,模型在 ScanNet 测试上达到领先水平(+18 mAP@50),并在实现 3D 实例分割 - IJCAI细粒度实体类型自动嘈杂标签纠正
本文提出了一种新方法,通过估计先前模型的逻辑输出确定潜在的嘈杂标签,然后训练一个鲁邦模型来除去剩余的噪声标签,从而自动校正 FINE-Grained 实体类型任务中的嘈杂标签,证明了方法的有效性。
- AAAI使用点监督的弱监督显著物体检测
本文采用点监督的方法提出一种新的弱监督显著性物体检测方法,并使用自适应遮罩洪水填充算法生成伪标签,和基于 Transformer 的模型进行训练,同时提出了一种 Non-Salient Suppression(NSS)方法来针对第一轮训练中 - ACLPRBoost:基于提示的规则发现和增强交互式弱监督学习
PRBoost 是一种交互式弱监督学习模型,通过迭代基于提示的规则发现和模型增强,自动发现新标签规则并生成补充弱标签,实验表明 PRBoost 在四个任务中的表现优于基线模型。
- CrowdMLP: 多粒度 MLP 弱监督人群计数
本文提出了一种新的对全局依赖性进行建模的多粒度 MLP 回归器 CrowdMLP,通过引入粗特征地图、多粒度 MLP 模型和自我监督 Split-Counting 任务等手段来解决弱监督学习中缺乏空间信息的问题,实验证明其表现优于现有弱监督 - CVPR弱监督语义对应的概率变形一致性
本文提出了概率 Warp 一致性,用于语义匹配的弱监督学习目标。我们的方法直接监督由网络预测的密集匹配分数,并在概率分布中编码。我们通过应用已知的 Warp 构造图像三元组来推导出我们的概率学习目标,然后使用由此产生的图像三元组的约束来推导 - 基于图像级弱监督视觉概念识别的非配对图像字幕生成
通过利用图像级别标签进行弱监督学习,提出解决成本昂贵的标注问题的无配对图像字幕生成模型,在视觉概念识别和图神经网络方面都取得了较好的表现。
- 基于双分支网络和动态混合拟标注监督的涂鸦辅助医学图像分割
本研究提出了一个简单而有效的基于标注涂鸦的医学图像分割方法,并应用于心脏核磁共振图像分割,结合了涂鸦监督和辅助伪标签监督的双分支网络能够高效地从标注涂鸦中学习,并取得了优于目前方法和半监督分割方法的表现。
- ICLR使用可微超几何分布学习群组重要性
本文提出可微分超几何分布,并利用其优势来显式地学习子集的大小,在弱监督学习和聚类两个应用中超越依赖于次优启发式模型集群大小未知的传统方法。
- CVPR再次探讨视觉知觉模型的弱监督预训练
本文介绍一项新的弱监督学习方法 —— 通过标签来监督预训练模型, 该方法使用现代残差网络和最大的图像数据集训练模型, 实现各种迁移学习的应用,甚至包括零样本学习,且与大规模自监督学习相比具有更好的性能。此方法有助于发展可靠的视觉识别系统。
- AAAISGEITL: 基于场景图增强的图像 - 文本学习,用于视觉常识推理
该论文提出了一种场景图增强的图像 - 文本学习框架,其中利用视觉场景图结构进行常识推理,通过多跳图变压器实现模型结构的正则化,引入了一种利用文本注释进行域相关的视觉场景图训练和生成的弱监督学习方法并在 VCR 和其他任务中进行了广泛的实验,