图像裁剪解析

Nov, 2020

Dissecting Image Crops

Basile Van Hoorick, Carl Vondrick

TL;DR本文研究了计算机视觉中的裁剪操作对图像质量的影响，特别是对于色彩像差和暗角等图像瑕疵的快速检测与矫正，并探讨了其对神经网络学习的影响。

Abstract

The elementary operation of cropping underpins nearly every computer vision system, ranging from data augmentation and translation invariance to computational photography and representation learning. This paper i

computer vision cropping chromatic aberration vignetting neural networks

发现论文，激发创造

自动图像剪裁算法的定量分析：数据集和比较研究

本研究通过对传统方法和基于排名的图像剪裁器的研究，讨论了基于学习排名算法处理自动图像剪裁问题。此外，作者还提出了一个新数据集，以评估各种基线算法的表现。实验结果为设计更好的自动剪裁算法提供了有价值的见解。

Jan, 2017

由美学照片学习组合，实现图像剪裁的端到端神经网络

该论文提出了一种基于深度学习的图像裁剪方法，利用卷积神经网络和回归网络，仅需一个锚定区域即可直接输出最终结果，从而实现高精度和高效率。

Jul, 2019

使用深度神经网络和级联回归进行自动图像裁剪以进行视觉美学增强

本文提出了一种基于级联裁剪回归（CCR）的图像裁剪方法，使用专业摄影师的知识来学习裁剪。利用大规模视觉美学数据集训练了一个深度卷积神经网络（CNN）分类器，再在几个图像裁剪数据集中提取特征，由 CCR 方法预测裁剪边界框，实验结果表明该方法显着优于几种最先进的图像裁剪方法。

Dec, 2017

设计约束下的图像裁剪

提出一种基于评分函数的图像裁剪方法，其计算裁剪结果的分数是否在美学上可行并满足设计约束条件，并对在设计约束下的图像裁剪提出两种派生方法：基于提案的方法和基于热图的方法。实验证明，所提出的方法在图像裁剪方面优于基准方法，基于提案的方法在相同计算成本下优于基于热图的方法，但基于热图的方法在增加计算成本的情况下获得更好的分数。实验结果表明，在美学上可行的区域和满足设计约束条件之间的平衡是一个触动灵敏的问题，并且两种所提出的方法都是合理的选择。

Oct, 2023

可靠高效的图像裁剪：一种基于网格锚点的方法

本文提出了基于 grid anchor 的图像裁剪公式，并设计了有效的轻量级神经网络，同时考虑 ROI 和 ROD，从而在不同场景下运行并稳定输出具有高视觉感受性的图像截图。

Apr, 2019

通过绘画专业照片来学习主题感知裁剪

通过将库存图像与现代预训练的文本 - 图像扩散模型相结合，我们提出了一种弱监督方法（GenCrop），用于从专业库存图像中学习高质量的主题感知裁剪，从而自动生成了一大批裁剪 - 未裁剪的训练对。尽管是弱监督的，GenCrop 在定量和定性评估指标上与最先进的监督方法相媲美，并且比可比的弱监督基线方法显着优秀。

Dec, 2023

利用现有的深层网络进行字幕和美学引导的图像裁剪

我们提出了一种新颖的优化框架，它可以基于用户描述信息和美学目标对给定图像进行裁剪，通过重新利用预训练的图像标注和美学任务网络直接优化裁剪参数，并通过多种策略实现了优化目标的实现，定量与定性实验证明我们的框架可以产生符合预期的用户描述和审美标准的裁剪图像。

Jan, 2022

通过注意框预测和美学评估实现深度裁剪

本文提出了一种通过级联注意框回归和美感质量分类的深度学习建模来解决照片剪裁问题的方法。该神经网络使用由两个分支构成的结构，能够预测注意力包围框并分析美感特征，通过共享特征来提高计算效率。实验结果表明，该方法在照片剪裁方面取得了很高的效果，具有竞争性的结果和快速的处理速度（所有步骤运行速度为每秒 5 帧），即便是在有限的照片剪裁训练数据的情况下。

Oct, 2017

比较不同人工智能范式、增强和裁剪策略学习的生物数据表示

该研究提出了一个简单的卷积神经网络架构，并在相同条件下使用不同的数据增强和裁剪策略训练了 16 种不同的深度学习模型，以比较其在药物识别、控制组分类和细胞聚类这三个下游任务中所学到的特征提取的性能和效率，其结果表明，多切割和随机增强通常能提高性能，而自我监督模型的性能也非常高，是训练速度最快的模型之一，但需要最大的内存和计算资源。

Mar, 2022

关于利用 DCT 统计量进行裁剪检测的探索

通过离散余弦变换 (DCT) 导出的频率成分的研究已被广泛应用于图像分析。最近观察到这些成分可以对图像的生命周期提供重要信息，但尚无研究专注于它们与图像的源分辨率之间的分析。本研究调查了一种新的图像分辨率分类器，该分类器采用 DCT 统计数据，旨在检测图像的原始分辨率；特别是利用此洞察力来解决识别裁剪图像的挑战。通过在整个图像上训练机器学习 (ML) 分类器 (而非裁剪过的图像)，生成的模型可以利用此信息来检测裁剪。结果表明，该分类器可靠地区分裁剪和非裁剪图像，可可靠估计其原始分辨率。此项突破对图像处理应用具有重要意义，包括数字安全、真实性验证和视觉质量分析，为检测图像操作和提升图像质量评估提供了新工具。这项工作为该领域开启了新的视角，具有潜力改变多个领域中的图像分析与使用。

Mar, 2024