基于单幅图像的三维视角训练数据增强方法对于高效的葡萄酒标签识别的影响

Apr, 2024

基于单幅图像的三维视角训练数据增强方法对于高效的葡萄酒标签识别的影响

Single-image driven 3d viewpoint training data augmentation for effective wine label recognition

Yueh-Cheng Huang, Hsin-Yi Chen, Cheng-Jui Hung, Jen-Hui Chuang, Jenq-Neng Hwang

TL;DR为解决复杂图像识别领域中训练数据不足的关键挑战，本论文引入一种新颖的 3D 视角增强技术，专门用于葡萄酒标签识别，通过从单个真实世界的葡萄酒标签图像中生成视觉逼真的训练样本来提高深度学习模型性能，克服了文字和标识的复杂组合带来的挑战。通过扩展训练数据集，充分利用经过时间验证的计算机视觉和图像处理策略，采用 Vision Transformer (ViT) 架构上的批次所有三元度量学习使用增强的训练图像，获得每个葡萄酒标签的最具区分性的嵌入特征，能够对已有训练类别中的葡萄酒标签或未来新收集的葡萄酒标签进行一次识别，实验结果显示与传统 2D 数据增强技术相比，识别准确性显著提高。

Abstract

Confronting the critical challenge of insufficient training data in the field of complex image recognition, this paper introduces a novel 3D viewpoint augmentation technique specifically tailored for wine label recognit

insufficient training data 3d viewpoint augmentation wine label recognition data augmentation recognition accuracy

发现论文，激发创造

从 2D GAN 数据中渐进式学习 3D 重建网络

本文介绍了一种使用生成式对抗网络（GAN）生成的多视角图像数据集重建高质量纹理三维模型的方法，其具有可忽略的注释成本，并通过多阶段学习和在线伪标签生成的新颖对抗学习流水线实现了精细的细节并显著改善了之前的方法。

May, 2023

计算机视觉中合成数据增强方法的调查

这篇论文对合成数据增强技术进行了广泛评估，包括基于真实 3D 图形建模、神经风格迁移、差分神经渲染、生成对抗网络和变分自编码器等生成人工智能技术。对于每一种方法类别，我们关注重要的数据生成和增强技术、广泛的应用范围和具体的用例，以及现有限制和可能的解决方法。此外，我们总结了用于训练计算机视觉模型的常见合成数据集，强调主要特点、应用领域和支持的任务。最后，我们讨论了合成数据增强方法的有效性，并希望通过这篇详细的论文为读者提供必要的背景信息和深入了解现有方法及相关问题。

Mar, 2024

GAN 增强：使用生成对抗网络进行训练数据增强

本文使用生成式对抗网络（GAN）生成的合成数据来增加医学成像训练数据集的样本数量，从而提高监督式机器学习算法对图像分割任务的性能。

Oct, 2018

生成逼真的训练数据以提高人脸识别准确性

本文研究使用合成数据来增强面部数据集的可行性。我们提出了一种新颖的生成对抗网络（GAN），可以将相关身份属性与非相关身份属性区分开来。我们的 GAN 能够生成数据增强的合成图像，并且该模型可以提高面部识别模型的准确率。

Oct, 2018

使用 GAN 进行合成数据增强，以提高自动化视觉检查的效果

本研究使用人工智能模型进行视觉质量检测，探讨了监督学习和非监督学习的缺陷检测技术以及数据增强技术，结果表明采用生成对抗网络进行数据增广可以获得最佳分类性能

Dec, 2022

远程感知图像中的数据增强和适应的条件生成对抗网络

使用 GAN 将给定的标记遥感图像拓展成更大的数据集并评测其对于物体检测任务的性能提升。

Aug, 2019

基于 GAN 的胸部 X 光分类数据增强

本文探讨了在医疗领域电脑视觉技术中普遍存在的数据样本数量不足和分类失衡的问题，并通过使用生成对抗网络技术来增强数据集以改善网络性能，结果表明这种方法适用于低数据的情况，是值得进一步研究的领域。

Jul, 2021

从单张图像中无监督生成新视角

本论文提出了一种基于生成对抗网络的条件生成模型，通过无监督学习实现在没有多视角、3D 和姿态监督的情况下进行从单一图像到新视角的合成。

Feb, 2021

贝叶斯数据增强方法用于深度模型学习

提出了一种基于贝叶斯公式，利用广义蒙特卡洛期望最大化算法和生成对抗网络的方法，能更好地生成新的标注训练样本，并在 MNIST，CIFAR-10 和 CIFAR-100 的数据集中取得了优于现有数据增强方法和 GAN 模型的分类结果。

Oct, 2017

2D GANs 遇见无监督单视角 3D 重建

提出了一种新的基于图像的神经隐式场方法，该方法利用基于 GAN 生成的多视图图像的 2D 监督，并通过不确定性模块来提高重构性能，从而实现了泛化物体的单视角 3D 重构。

Jul, 2022