MMCBE:用于作物生物量估计和更多领域的多模态数据集
准确估计地上生物量(AGB)是应对气候变化和生物多样性损失两大人类挑战的关键,我们引入了一个包含全球分布、多样植被类型和几年时间范围的全面新数据集,结合了来自 GEDI 任务的 AGB 参考数据以及 Sentinel-2 和 PALSAR-2 影像数据,并且还生成了整个数据集覆盖区域的密集、高分辨率(10m)AGB 预测地图,为全球 AGB 估计提供了可靠的基础。
Jun, 2024
提出了应急护理多模态临床基准(MC-BEC),这是一个综合性基准,用于使用 2020-2022 年连续监测的超过 100K 个急诊科访问的数据集评估应急护理中的基础模型。 MC-BEC 关注于分钟到天的时间尺度上的临床相关预测任务,包括预测患者恶化、病情处理和急诊访问,并包括了一个带有训练 - 测试分割和评估指标的标准化评估框架。多模态数据集包括广泛的详细临床数据,包括分诊信息、先前诊断和药物、持续测量的生命体征、心电图和光电信号波形、整个访问期间的医嘱和药物管理、成像研究的自由文本报告、急诊诊断、处理和随后再访的信息。我们提供了每个预测任务的性能基准,以便评估多模态、多任务模型。我们相信 MC-BEC 将鼓励研究人员开发更有效、具有普适性和易获得性的多模态临床数据基础模型。
Nov, 2023
BIOSCAN-5M 昆虫数据集是一个包含 500 万多个昆虫标本的综合数据集,通过包括分类标签、原核酸条形码序列、条形码索引以及地理信息等多模态信息,扩展了现有的基于图像的生物学数据集。研究通过提出三个基准实验,展示了多模态数据类型对分类和聚类准确性的影响。
Jun, 2024
通过引入 CropNet 数据集,该研究提供了一个多模态数据集,用于在县级别上准确预测作物产量,考虑了短期和长期气候变化的影响,并验证了其在气候变化感知作物产量预测中的一般适用性和有效性。
Jun, 2024
该研究介绍了 CitrusFarm 数据集,这是由一个在农田中操作的轮式移动机器人收集的综合多模态感官数据集。该数据集提供了包含深度信息的立体 RGB 图像,以及单色、近红外和热红外图像,提供农业研究所需的多样光谱响应。此外,它还提供了包括轮式里程计、激光雷达、惯性测量单元(IMU)和具有实时动态差分(RTK)的 GNSS 的导航传感器数据,作为以厘米级精度的定位基准。该数据集包含在三个柑橘树区域收集的七个序列,涵盖了不同生长阶段、独特的种植模式和不同的日光条件的各种树种。它总共运行时间为 1.7 小时,覆盖了 7.5 公里的距离,共计 1.3 TB 的数据。我们预计这个数据集可以促进在农业树木环境中操作的自主机器人系统的发展,特别是用于定位、地图制作和作物监测任务。此外,该数据集提供的丰富感知模式还可以支持一系列机器人学和计算机视觉任务的研究,例如地点识别、场景理解、物体检测和分割以及多模态学习。该数据集与相关工具和资源一起,已在该 https URL 上公开提供。
Sep, 2023
通过使用统计技术从生物物理数据中预测碳通量,世界上第一个机器学习准备就绪的数据集 CarbonSense 整合了全球 385 个地点的测量碳通量、气象预测因子和卫星图像,提供了全面的覆盖并促进了模型训练,同时通过提供基准模型和新的基于 Transformer 的模型,展示了多模态深度学习技术在该领域带来的潜在收益,旨在降低其他深度学习研究人员进入和推动碳通量建模领域的门槛。
Jun, 2024
为了解决现有数据集图片数量有限的问题,本文提出了一个包含图像和三维数据的多模态综合数据集,该数据集包含 28 类的像素级标注,并可用于深度网络架构的有效训练,结果表明其在合成数据和实际数据的适应方面具有良好的前景。
Aug, 2023
本研究提出了一种利用计算机视觉中的深度学习算法,通过少量已标注数据及近似标注数据来监测牧草干草生物量的低监督方法,其包括合成数据生成算法、自动标注数据处理过程和强健的回归网络。该方法在爱尔兰采集的牧草质量估计数据集上进行了设计,还对丹麦发布的草艹生物量估计数据集报告了最先进的结果。
Oct, 2021
提出了一种新的多模式基准测试方法 MMBench,通过精心策划的数据集和结合 CircularEval 策略和 ChatGPT 的方法来对大视觉语言模型进行综合评估,旨在帮助研究社区更好地评估其模型以及鼓励未来的进步。
Jul, 2023
本文提出了一种适应性实时多模态回归和生成框架来解决卫星数据稀疏性的挑战,并在 CVPR 2022 的 MultiEarth 矩阵完备性挑战中取得了优异的性能,其中包括 LPIPS 为 0.2226,PSNR 为 123.0372 和 SSIM 为 0.6347。
Jun, 2022