- 利用无人机在芬兰森林和沼泽地采集的野生浆果图像数据集
野生浆果图像数据集 WildBe 使用无人机捕获了芬兰泥炭地和树冠下的新品种浆果,评估了六种流行的物体检测器在不同森林地区和相机类型中检测浆果的有效性,并将其公开发布。
- 质量对细粒度图像分类中的深度神经网络的影响
本文提出一种无参考图像质量评估(NRIQA)引导截断点选择(CPS)策略,以提高细粒度分类系统的性能。通过综合多种 NRIQA 方法提供的截断点信息,选择给定图像数据集中最具区分性的子集,可以在深度神经分类器上进一步增强模型的准确性。
- 随机掩码比率的遮蔽潜变换器用于提升牙齿氟斑病诊断
通过构建第一个开源牙齿氟斑图像数据集(DFID)以及引入基于视觉 Transformer 的掩码潜变换模型(MLTrMR)来推进牙齿氟斑的诊断, MLTrMR 在 DFID 上取得了 80.19%的准确率,75.79%的 F1 值和 81. - GT-Rain 单图像去雨挑战报告
这篇报告回顾了 CVPR 2023 UG2+ 研讨会上单张图像去雨 GT-Rain 挑战的结果,目标是研究真实场景中的雨天现象,提供一个新颖的真实世界雨景图像数据集,并激发创新思路,推动单张图像去雨方法在真实图像上的发展。
- 在自然环境中情感识别的图像数据集:FindingEmo
我们引入了 FindingEmo,一个新的图像数据集,包含对 2.5 万张图片的注释,专门用于情绪识别。与现有数据集相反,它专注于描绘多个人物在各种自然、社交环境中的复杂场景,注释是整体进行的,超越了传统对人脸或单个人的关注。注释的维度包括 - ECPC-IDS:一份用于评估语义分割和高代谢区域检测的子宫内膜癌 PET / CT 图像数据集
发表了一份公开可用的子宫内膜癌 PET/CT 图像数据集 (ECPC-IDS),它包含大量的图像和标注信息,用于支持深度学习语义分割和目标检测方法,有助于增强计算辅助技术,从而为临床医生和患者带来极大的好处。
- 利用深度学习自动化细纤维材料显微图像中的木材种类检测与分类
我们开发了一种用于系统生成大型显微纤维材料的图像数据集的方法,基于此方法,我们生成了用于九种硬木属的图像数据。这是首次通过深度学习自动化识别显微图像中的硬木物种的实质性方法的基础。我们的方法包括一种灵活的管道,用于容易地注释管胞要素。我们比 - 2023 年脑瘤分割 (BraTS) 挑战赛:基于脑 MR 图像合成的肿瘤分割 (BraSyn)
为了更广泛地将自动脑肿瘤分割算法应用于临床,建立了 Brain MR 图像合成基准(BraSyn),用于基准测试图像合成方法来合成缺失的 MRI 模态,以实现多模态且多样化的数据集。
- 基于半自动计算机视觉的多个工业实体的跟踪 -- 框架和数据集创建方法
介绍了 TOMIE 框架,用于连续跟踪工业实体(例如托盘、箱子、桶)的位置,包括多种传感器和数据处理算法,这个框架已被应用于工业中采集数据集,名为 TOMIE 数据集,并使用三种跟踪算法赋予实验证明,结果与同类数据集相比有所改善。
- ECCVFew-Shot 分割中的类原型关系
本研究提出了一种叫做 “IPRNet” 的方法,采用在原型空间中的原型关系来增强少样本数据在特征空间中的区分性,该方法在 Pascal-5i 和 COCO-20i 数据集上具有优秀的分割性能。
- MM分层与渐进式图像抠像
本文提出了一种层级与渐进式的注重力抠图网络(HAttMatting++)以更好地从单个 RGB 图像预测前景的不透明度,同时介绍了一个具有挑战性的图像抠图数据集并采用多种损失函数引导网络进行训练,此网络可以捕捉复杂的前景结构并实现单个 RG - ECCVDSR:面向无人机图像超分辨率的研究
本研究提出了一种无人机图像数据集,针对不同高度的低分辨率和高分辨率图像,通过对现有网络的微调和高度感知机制的引入,使得在新的领域中的超分辨率任务的性能得到提升。
- 利用深度学习模型检测猴痘皮损:可行性研究
本文开发了一个 “猴痘皮肤病变数据集”,并使用多种预训练深度学习模型对猴痘及其他疾病进行分类,最终实现了一个在线筛查工具。虽然初步结果有所希望,但需要更大样本的数据集以进一步提高模型的泛化能力。
- CVPRHCSC: 分层对比选择编码
提出了一种新的对比学习框架 HCSC,可以通过构建并动态更新一组层次结构原型来表征图片数据中的层次语义结构,并且通过一种精心设计的对对选择方案来让图像表示更好地适应这些语义结构。在广泛的下游任务中,证明了 HCSC 优于现有对比方法,其重要 - 无监督深度图像拼接:重建拼接特征到图像
本论文提出了一种基于无监督深度学习的图像拼接框架,包括无监督的粗略图像对齐和无监督的图像重建两个阶段,使用了降分辨率变形支路和提高分辨率的精化支路,其精度优于现有的其他技术。
- 用于伪装目标分割的支流网络
本文主要探索追踪伪装物体的图像分割问题,提供一个新的伪装物体数据集,提供了一种通用的端到端网络 ——Anabranch 网络,融合了分类和分割功能,采用多种全卷积网络评估其在新构建的数据集上的效果。
- ICCVRaidaR: 一个富有注释的下雨街景图像数据集
本研究介绍了 RaidaR 一个富注释的雨天驾驶场景图像数据集,包含最大数量的雨天图片,同时提供语义分割和物体实例分割等注释,用于提高数据驱动的机器感知能力,并展示数据增强与分割算法中的实用性。同时提出了一种可节省注释时间的半自动化方案,并 - 东鸟国际鸟类 10000 数据集
DIB-10K 是一个具有挑战性的图像数据集,包含了一万多种不同类型的鸟类,旨在促进机器学习和鸟类学研究,但不拥有这些图像的版权,只提供缩略图。
- CVPRSIDOD: 一种用于带有分心物体的 3D 物体姿态识别的合成图像数据集
该研究介绍了一个由 NVIDIA 深度学习数据合成器生成的新的、可公开获取的图像数据集,用于目标检测、姿势估计和跟踪应用。该数据集包含 144k 个立体图像对,将三个真实环境中的 18 个相机视角合成,其中实验对象包括最多 10 个随机选择 - 为何归一化流无法检测到超出分布范围的数据
本文探讨了正则化流在检测异常数据方面的性能问题,发现正则化流架构具有局部像素相关性和通用图像到潜空间转换的缺陷,并通过修改它的架构,使其更好地适应特定数据语义结构,进而提高检测性能。