从单张图像中盲目去除视觉图案
本文介绍了一种基于计算机视觉的算法,利用多样性特征融合和区域投票技术可以准确地搜索和定位艺术品中指定的图案或物体,有效地解决了大规模数字化艺术品数据集的图像检索问题。
Jul, 2021
本文提出了一种语义优化方法,称为视觉语义损失(VSL),以辅助模型专注于图像的主要内容,通过对图像的注释文本的利用,减少次要内容的负面影响,通过两个基准数据集(MSCOCO 和 Flickr30K)的大量实验,证明了该方法的卓越性能。
Apr, 2023
该论文提出了一个名为 Blind2Unblind 的简单而有效的方法来克服盲点驱动去噪方法中的信息丢失问题,该方法采用全局感知掩模映射器和可重视损失来提高性能,实验表明该方法在合成和真实世界数据集上优于以前的工作。
Mar, 2022
本文提出使用对象语义作为指导力量,强制将相同对象分配到同一层次来解决玻璃窗后的图像反射问题,并在不同数据集上进行了实验证明该方法的显著性能优势及其在计算机视觉任务中的应用。
Jul, 2019
本文利用基于显式目标信息的简单的可解释且强大的表示方法解决了探测篡改图片标题的任务,并在标准数据集上取得了优于人类的成绩;同时分析揭示了简单模型即使没有图像信息也能取得良好的表现,表明数据集具有强烈的语言倾向。
May, 2018
我们提出了一种简单而易于解释的推理模型,用于生成全局场景的主要对象和语义概念的可视化表示,该模型使用图卷积网络进行关联和推理,再使用门和记忆机制进行全局语义推理,选取判别信息并逐渐生成整个场景的表示;实验证明我们的方法在 MS-COCO 和 Flickr30K 数据集上取得了相对于最佳方法分别为 6.8%和 4.8%的图像检索和字幕检索的新的最佳效果,Flickr30K 数据集上分别提高了 12.6%和 5.8%的图像检索和字幕检索。
Sep, 2019
本文提出了一种新的盲目修复网络,使训练过程在未知的缺失区域模式下更加鲁棒,并且通过语义不一致性的估计和新的空间归一化方法,使视觉修复更加精细,实验表明该方法在盲目图像修复方面相当有效。
Mar, 2020
本文提出了一个基于编码器 - 解码器模型的快速视频字幕去除框架,使用多个源帧和残差连接来处理视频中的遮挡和缺失,进一步通过循环反馈实现对时间上的连续性和缺失像素位置的准确预测,实现了实时的视频去字幕操作。
May, 2019
本文介绍了一种基于图的盲图像去模糊算法,该算法通过将图像块解释为加权图上的信号来解决盲图像去模糊问题。该算法可通过稳健的滤波和尖锐度提升等优秀性能有效恢复出潜在的清晰图像,并在质量和数量上优于现有的方法。
Feb, 2018
本研究通过分析场景图中常规出现的子结构 (即 motifs),研究如何生成场景的结构化图形表达,并构建了一种能够捕捉场景图中高阶 motifs 的新架构 —— 堆叠 motif 网络 (Stacked Motif Networks)。通过在 Visual Genome 数据集上实验,结果表明我们的基准模型获得了 3.6%的相对改进,并且该新架构又减少了相对 7.1%的误差。
Nov, 2017