Feb, 2024

BIKED++:一个包含 140 万张自行车图像和参数化 CAD 设计的多模态数据集

TL;DR该论文介绍了一个公共数据集,其中包含了 140 万个以参数方式表示的、程序生成的自行车设计,以 JSON 文件和栅格化图像形式提供。该数据集的创建依赖于一个渲染引擎,该引擎利用 BikeCAD 软件从参数化设计生成矢量图形。论文讨论了这个渲染引擎,并与数据集一起公开发布。尽管该数据集有众多应用,主要动机之一是需要训练参数化和基于图像的设计表示之间的交叉模态预测模型。例如,我们演示了可以训练预测模型,直接从参数化表示准确估计 Contrastive Language-Image Pretraining (CLIP) 嵌入。这样可以建立参数化自行车设计与文本字符串或参考图像之间的相似性关系。已公开发布了训练好的预测模型。该数据集是 BIKED 数据集系列的一部分,包括数千个混合表示的人工设计自行车模型和几个量化设计性能的数据集。代码和数据集可以在 this https URL 找到。