- MS-Former: 基于记忆支持的弱监督改变检测的变压器模型与补丁级注解
本文提出了一种基于记忆支持的 Transformer (MS-Former) 框架,通过双向注意力块和针对弱监督变化检测的补丁级监督方案 (PSS),从补丁级标注中捕捉到与变化和未变区域相关的语义变化,以获取更好的变化结果。实验结果表明我们 - 胸部 X 射线图像的弱监督异常检测
针对少样本异常图像的弱监督胸部 X 光检测方法(WSCXR)的研究。WSCXR 通过利用异常特征挖掘消除正常区域特征并采用线性混合策略增强异常特征,从而充分利用疾病区域的关键特征,实现了对异常图像的有效检测。
- 引入多实例学习中的实例标签相关性。应用于组织病理图像癌症检测
本文通过引入与统计物理的 Ising 模型相关的新偶合项扩展了一种基于高斯过程的最先进弱监督多实例学习方法 (VGPMIL-PR),提高了在组织病理学图像中检测前列腺癌的效果,并通过可视化和分析提供了洞察力,有望在其他研究领域中应用该模型。
- xMEN:跨语言医学实体归一化的模块化工具包
通过 xMEN 系统,在多种语言中改善医疗实体的归一化性能,特别是当与英语相比,其他语言资源较少时。
- 为实现精细化实体类型标注而进行的本体增强
OnEFET 是一种无需人工注释的高质量细粒度实体类型方法,通过对本体结构进行信息扩充,并利用训练样本扩充和话题信息的粗到细的分层方法,超越现有的零样本方法,赶上有监督方法。
- 基于边框的弱监督和无监督定位任务优化
训练基于框的检测器网络可以提高弱监督和无监督方法的定位性能,并且我们通过证明这些检测器可以用于改进原始网络从而为进一步的发展铺平了道路。我们通过在网络输出而不是图像数据上训练检测器并应用适当的损失反向传播方法来实现这一目标。我们的发现表明这 - VadCLIP: 适应弱监督视频异常检测的视觉语言模型
通过直接利用对比式语言 - 图像预训练模型 (CLIP) 在视频领域的强大表示能力和设计鲁棒的视频异常检测器,本文提出了 VadCLIP,一种弱监督视频异常检测范例,无需预训练和微调过程,通过双分支实现粗粒度和细粒度的视频异常检测,实验结果 - ICCV利用跨语言手势改进连续手语识别
该研究旨在通过利用多语种手语语料库来促进单一语种的连续手语识别,通过识别跨语种手语并将其作为辅助训练数据,从而提高其识别能力。实验结果表明,该方法在两个广泛使用的连续手语识别数据集上取得了最先进的性能。
- WeakPolyp: 仅对息肉分割进行边框查找
基于边界框注释,我们提出了一种弱监督的息肉分割模型(WeakPolyp),使用 mask-to-box 转换减少粗糙标签与精确预测之间的不匹配,并通过尺度一致性损失实现密集监督,实验证明 WeakPolyp 在不需要任何遮罩注释的情况下达到 - ClickSeg:基于点击层次弱标注的 3D 实例分割
本文提出了 ClickSeg,一种新颖的基于点击级弱监督的 3D 实例分割方法,仅需要每个实例的一个点注释;通过提出基线弱监督训练方法和新的训练框架,使用 k-means 和固定初始种子进行聚类,实验证明 ClickSeg 在 ScanNe - CG-fusion CAM: 大孔径光学元件激光损伤在线分割
本文提出了一种基于连续梯度 CAM 及其非线性多尺度融合 (CG-fusion CAM) 的弱监督语义分割方法,通过重新设计梯度的反向传播方式和非线性激活多尺度融合热图,生成了更精细的类激活图,适合不同大小的损伤区域,实验结果表明所提出的方 - 自上而下视角的基于图像实体的图像字幕生成
本研究提出了一种一阶段的弱监督图像标题生成方法,通过注入关系模块来鼓励多标签分类中的关系理解,从而提高了关注性能和字幕生成准确性,并在两个具有挑战性的数据集上验证了该方法的有效性。
- 在双曲空间中学习弱监督的音视频暴力检测
本文提出了一种基于超几何空间的弱监督音视频暴力检测框架 HyperVD,通过多模态融合和全超几何图卷积网络等方法来提高模型的判别能力,收益于在此空间中学习片段表示方法,最终在 XD-Violence 基准测试中超越同领域最优性能的方法。
- ACL基于相对表示的弱监督视觉语言预训练
本研究提出了使用相对表示(relative representations)来构建跨模态锚点,从而实现高质量的图像 - 文本对预训练的 WVLP 框架 RELIT,并通过四个下游任务的实验表现得出了新的最先进结果。
- 去偏才能提高性能:重新审视基于简单种子的弱监督文本分类
本文重新审视种子匹配法,表明种子匹配法的性能被低估,并提出了减轻标签偏见的简单方法,从而提高了种子匹配法的性能,使其达到甚至优于先进技术的水平。
- 多粒度去噪和双向对齐用于弱监督语义分割
这篇研究使用 “多粒度降噪和双向对齐(MDBA)” 模型,通过 online noise filtering 和 progressive noise detection 模块来解决图像级别和像素级别噪声以及多类问题,并提出了双向对齐机制,以 - Segment Anything 是一个弱监督语义分割的良好伪标签生成器
本研究旨在探讨通过利用弱标签作为暗示来生成准确的分割掩码,并将其作为趋近于真实标签的伪标签来训练分割网络中的潜力。在 PASCAL VOC 2012 数据集上的实验证明了 segment-anything 可以作为良好的伪标签生成器。
- 可训练原型增强的多示例学习用于全切片图像分类
该研究论文提出了一种基于原型学习和多实例学习的 Trainable Prototype enhanced deep MIL (TPMIL) 框架,用于弱监督下的 WSI 分类,其不需要依赖于选定的图像补丁,能够更准确地识别肿瘤亚型。
- 双向语义一致性约束的弱监督时间动作定位
该研究提出了一种名为双向语义一致性约束的方法来改善当前弱监督下的视频分类及定位发现问题。该方法采用时间相关增强来打破正样本动作与其 co-scene 动作之间的相关性,通过语义一致性约束来获得足够的信息区分两者,从而较好地应用于当前的 WT - 婴儿啼哭的弱监督检测
使用弱监督的异常检测方法,结合卷积神经网络和预训练特征提取器检测宝宝的哭声。