可靠高效的图像裁剪:一种基于网格锚点的方法
本研究提出了一种基于网格锚定的图像裁剪模型,通过考虑图像裁剪的特殊性质和要求,如本地冗余、内容保留、宽高比,构建了一个网格锚定裁剪基准,并定义了更可靠的评估指标。同时,该模型模型还采用了多尺度信息,可以为不同场景的图像稳健地输出视觉上令人愉悦的裁剪。
Sep, 2019
该论文提出了一种基于深度学习的图像裁剪方法,利用卷积神经网络和回归网络,仅需一个锚定区域即可直接输出最终结果,从而实现高精度和高效率。
Jul, 2019
本研究通过对传统方法和基于排名的图像剪裁器的研究,讨论了基于学习排名算法处理自动图像剪裁问题。此外,作者还提出了一个新数据集,以评估各种基线算法的表现。实验结果为设计更好的自动剪裁算法提供了有价值的见解。
Jan, 2017
提出一种基于评分函数的图像裁剪方法,其计算裁剪结果的分数是否在美学上可行并满足设计约束条件,并对在设计约束下的图像裁剪提出两种派生方法:基于提案的方法和基于热图的方法。实验证明,所提出的方法在图像裁剪方面优于基准方法,基于提案的方法在相同计算成本下优于基于热图的方法,但基于热图的方法在增加计算成本的情况下获得更好的分数。实验结果表明,在美学上可行的区域和满足设计约束条件之间的平衡是一个触动灵敏的问题,并且两种所提出的方法都是合理的选择。
Oct, 2023
本文提出了一种通过级联注意框回归和美感质量分类的深度学习建模来解决照片剪裁问题的方法。该神经网络使用由两个分支构成的结构,能够预测注意力包围框并分析美感特征,通过共享特征来提高计算效率。实验结果表明,该方法在照片剪裁方面取得了很高的效果,具有竞争性的结果和快速的处理速度(所有步骤运行速度为每秒 5 帧),即便是在有限的照片剪裁训练数据的情况下。
Oct, 2017
我们提出了一种新颖的优化框架,它可以基于用户描述信息和美学目标对给定图像进行裁剪,通过重新利用预训练的图像标注和美学任务网络直接优化裁剪参数,并通过多种策略实现了优化目标的实现,定量与定性实验证明我们的框架可以产生符合预期的用户描述和审美标准的裁剪图像。
Jan, 2022
本研究提出使用基于作物的训练策略进行图像分割,解决了 GPU 内存消耗问题,同时通过引入新的注重剪裁平衡的边界框回归损失和数据采样增强策略以改善多尺度下的泛化,将该方法应用于 MVD、Indian Driving 和 Cityscapes 数 据集中,取得了 + 4.5% PQ 和 + 5.2% mAP 的最新成果。
Dec, 2020
本文提出了一种基于级联裁剪回归(CCR)的图像裁剪方法,使用专业摄影师的知识来学习裁剪。利用大规模视觉美学数据集训练了一个深度卷积神经网络(CNN)分类器,再在几个图像裁剪数据集中提取特征,由 CCR 方法预测裁剪边界框,实验结果表明该方法显着优于几种最先进的图像裁剪方法。
Dec, 2017
本研究提出了一种名为 “Guided Anchoring” 的替代方案,该方案利用语义特征引导区域 anchor 的选择,并成功将其应用在目标检测和 Proposal 方法中,相比 RPN 基线,在 MS COCO 数据集上使用 “Guided Anchoring” 能够在减少 90% anchor 数量的情况下提高 9.1% 的召回率,同时在 Fast R-CNN、Faster R-CNN 和 RetinaNet 中将检测 mAP 分别提高了 2.2%、2.7%和 1.2%。
Jan, 2019