东鸟国际鸟类 10000 数据集
本文介绍了一个大规模的数据集 AirBirds,其中包含了 118,312 个时间序列图像,覆盖了 409,967 个飞鸟的边框注释,是首个在真实机场环境中直接收集飞鸟的、用于研究和实践鸟击防护的大规模数据集。
Apr, 2023
我们推出了一个新的野生动物重新识别数据集 WildlifeReID-10k,包含超过 214k 张 10k 只个体动物的图像。该数据集由 30 个现有的野生动物重新识别数据集加上额外的处理步骤组成。我们认为,由于数据集中相似图像的普遍存在,标准(随机)的训练集和测试集划分对于野生动物重新识别是不适当的,并提出了一种基于提取特征相似性的新的相似性感知划分。为了促进公平的方法比较,我们针对封闭集和开放集设置都提供相似性感知划分,使用 MegaDescriptor 作为野生动物重新识别的基准模型,同时提供最佳结果的排行榜。我们公开发布数据集以及用于创建它的代码在 wildlife-datasets 库中,使得 WildlifeReID-10k 既高度精选又易于使用。
Jun, 2024
本文介绍了一个新的半监督识别数据集,该数据集包含来自 iNat-2018 数据集中抽样得到的 1000 种鸟类,总共近 15 万张图像。该数据集的存在挑战着现有文献中的半监督识别技术,因为它包含领域外数据、类不平衡和类之间的微妙相似性。
Mar, 2021
本论文提出了 iNaturalist 物种分类和检测数据集,包括来自全球 5000 多种植物和动物的 859,000 张图片,其中包括视觉相似的物种以及具有各种图像质量和类不平衡性的图片。通过对数据集进行广泛的基准实验,本文的结果表明目前基于非集成方法的计算机视觉分类和检测模型只能达到 67% 的准确率,提出了面临的挑战和需要更多低阶学习关注的解决方案。
Jul, 2017
本文提出了扭曲文档图像数据集(DDI-100),该数据集是基于 7000 张真实唯一的文档页面的合成数据集,包含超过 100000 个增强图像,标注信息包括文本和邮戳掩模、文本和字符边界框等,验证结果表明该数据集在文档分析等多种领域有很好的实用价值。
Dec, 2019
该论文提出了一个名为 SOD4SB 的新的 SOD 数据集,包含 39,070 张图像和 137,121 个鸟实例,旨在解决远距离小物体检测中的噪声、模糊和信息不足等挑战,并介绍了此挑战的细节、获奖方法、数据集、基准代码和公开测试集评估网站。
Jul, 2023
通过众包的方式,我们创建了 KonIQ-10k 数据集,该数据集是目前最大的图像质量评估数据集,共计包括 10,073 张有质量评分的图像。我们还提出了一种新的运用深度学习的模型 KonCept512,该模型通过 InceptionResNet 架构进行训练,在高分辨率的数据集上具有了比现有技术更好的泛化性能(SROCC0.921)
Oct, 2019
介绍了一个名为 Birds-to-Words 的新数据集,包含用自然语言描述鸟类的语句,使用了一种新的分层抽样方法,提出了一个名为神经博物学家(Neural Naturalist)的模型来生成,评估结果表明,神经模型具有用自然语言解释视觉嵌入空间中差异的潜力,并为机器学习提供了一条资助公民科学家保护生物多样性的具体路径。
Sep, 2019
深度学习模型在鸟类生物声学中作为强大的工具出现,但是研究中的不一致性对这一领域的进展构成了重大挑战。为了克服这些挑战,我们提出了 BirdSet 基准测试,这是一个统一的框架,通过整体方法来对鸟类生物声学中的鸟叫进行分类。BirdSet 通过将开源鸟类录音整合到一个经过精心策划的数据集合中,为当前模型的基线结果建立了统一的基础,旨在促进可比性、指导后续数据收集,并提高对鸟类生物声学的新手的可访问性。
Mar, 2024
本文介绍了建立高效鸟类计数系统的流程,利用合成数据集进行密度图估计,使用模型压缩技术和高效模型结构降低了存储成本从而提高了推理速度。
Dec, 2019