Oct, 2023

盲约:审视历史照片中的时间性表达

TL;DR该研究探讨了计算机视觉模型在识别视觉内容中的时间信息方面的能力,重点关注历史照片。研究使用了OpenCLIP,一个多模态语言和视觉模型的开源实现,对图像的日期进行了研究。实验包括零样本分类,微调和视觉内容分析三个步骤。结果显示,零样本分类对图像约会方面相对无效,并且存在向过去预测日期的偏见。通过使用逻辑分类器对OpenCLIP进行微调可以提高性能并消除偏见。此外,分析结果表明,包含公共汽车、汽车、猫、狗和人物的图像的日期更加准确,暗示了时间标记的存在。该研究突出了OpenCLIP等机器学习模型在图像约会方面的潜力,并强调了微调对于准确的时间分析的重要性。未来的研究应该探索这些发现在彩色照片和多样化数据集中的应用。