AnyPattern:朝向上下文中的图像复制检测
本研究提出了 CODE 方法,它是一种可解释人工智能领域的扩展工作,用于识别类别特定的重复模式,以构建强大的用于视觉分类器的离群检测方法。CODE 不需要对分类器进行重新训练,且与离群分布无关,直接针对训练数据集进行调优。关键在于模式识别,使得我们能够提供来自内部分布数据集的图像作为参考数据,为置信度提供额外的上下文。此外,我们还引入了一种基于内部分布数据集的扰动的新基准,作为内部分布和离群分布数据集之间差异的已知可量化度量值,以用于比较离群检测方法。
Oct, 2023
本文提出了一个特征鲜明的 Image copy detection(图片复制检测)基准测试集,包括添加了具有强扰动性的 hard negative queries,作者进一步阐述了度量学习和 ICD 之间的对称 - 非对称的冲突,并提出了一种新的学习方法:Asymmetrical-Similarity Learning (ASL),该方法不同于以往度量学习采用的对称距离,它允许两个方向上的相似度(查询图片 <-> 参考图片)彼此不同。ASL 的实验结果表明其在硬负样本图像复制检测上的性能明显优于同类方法。
May, 2022
通过使用在图像修复中预训练的文本到图像扩散模型,我们提出了 Analogist 作为一种新颖的推理型视觉上下文学习方法,旨在利用视觉和文本提示技术,提高任务的泛化能力和上下文感知能力,从而在各种视觉任务中取得优越性能。
May, 2024
使用少样本学习的正常图像为提示,在不同数据集上训练一个综合上下文残差学习模型(InCTRL)进行广义异常检测,以区分异常和正常样本之间的残差来实现跨不同领域的泛化能力。
Mar, 2024
使用同类前景图像的参考图像和引导先验,提出了上下文抠图的新任务设置。为了克服精确前景匹配的关键挑战,引入了 IconMatting,一种基于预训练文本到图像扩散模型构建的上下文抠图模型。在 ICM-57 测试集上的定量和定性结果表明,IconMatting 在保持自动化抠图水平的同时,与基于 trimap 的抠图方法相媲美。
Mar, 2024
新的简单视觉上下文学习(ICL)方法 SimICL 结合被设计用于自监督学习的屏蔽图像建模(MIM)对配对图像进行视觉 ICL,成功地在具有有限注释的腕部超声数据集上验证,对于骨骼结构分割取得了非常高的 Dice 系数(DC)和 Jaccard 指数(IoU),并能减少图像标注需要的人工专家时间,提高超声图像分析中人工智能辅助的实际应用。
Feb, 2024
该研究提出使用可解释 AI 领域的 PARTICUL 算法以构建更易解释、更具鲁棒性的视觉分类器的异常检测器,无需重新训练分类器,适用于缺乏明确定义的领域,并通过四个数据集和两个 OoD 定义的广泛基准测试证明了该方法的检测能力与现有方法相当,同时强调了分类器结构对鲁棒性的影响。
Jan, 2023
本研究探讨了模拟推理对于在可组合元素的视觉刺激下的情境组合的学习的作用,并提出了一个名为 Im-Promptu 的元学习框架,用于训练多个具有不同组成水平的代理。实验揭示了推广能力和组合度之间的权衡,可以扩展学习到的组合规则到看不见的域,但在组合任务上表现不佳。集中于对象的标记方法配合交叉注意模块生成一致和高保真的解决方案,这种感性偏见特别关键。最后,我们展示了 Im-Promptu 作为图像生成的直观编程界面的用例。
May, 2023
利用生成图像模型检测新闻中图像与标题对的脱离语境使用,为廉价伪造检测领域的进一步研究提供新方法和数据集,通过定性和定量分析评估图像生成模型及图像相似度计算方法的性能。
Aug, 2023
该论文介绍了一种基于自适应扰动模式的方法,用于在灰盒情况下生成具有真实性的对抗样本,通过对企业和物联网网络进行案例研究,证明了该方法提供了可扩展的对抗样本生成技术,并在对抗训练和攻击中具有优势。
Mar, 2022