Jun, 2024

BIOSCAN-5M:一种昆虫生物多样性的多模式数据集

TL;DRBIOSCAN-5M 昆虫数据集是一个包含 500 万多个昆虫标本的综合数据集,通过包括分类标签、原核酸条形码序列、条形码索引以及地理信息等多模态信息,扩展了现有的基于图像的生物学数据集。研究通过提出三个基准实验,展示了多模态数据类型对分类和聚类准确性的影响。