盲约：审视历史照片中的时间性表达

Oct, 2023

盲约：审视历史照片中的时间性表达

Blind Dates: Examining the Expression of Temporality in Historical Photographs

Alexandra Barancová, Melvin Wevers, Nanne van Noord

TL;DR该研究探讨了计算机视觉模型在识别视觉内容中的时间信息方面的能力，重点关注历史照片。研究使用了OpenCLIP，一个多模态语言和视觉模型的开源实现，对图像的日期进行了研究。实验包括零样本分类，微调和视觉内容分析三个步骤。结果显示，零样本分类对图像约会方面相对无效，并且存在向过去预测日期的偏见。通过使用逻辑分类器对OpenCLIP进行微调可以提高性能并消除偏见。此外，分析结果表明，包含公共汽车、汽车、猫、狗和人物的图像的日期更加准确，暗示了时间标记的存在。该研究突出了OpenCLIP等机器学习模型在图像约会方面的潜力，并强调了微调对于准确的时间分析的重要性。未来的研究应该探索这些发现在彩色照片和多样化数据集中的应用。

Abstract

This paper explores the capacity of computer vision models to discern temporal information in visual content, focusing specifically on historical photographs. We investigate the dating of images using

发现论文，激发创造

百年肖像：美国高中年鉴的视觉历史记录

该研究通过对大规模历史图像数据集进行自动化分析，发现历史时尚的视觉趋势并识别与日期相关的视觉模式，同时开发了一个分类器以预测肖像照片的拍摄时间。

Nov, 2015

那是什么时候制作的？

本文提出了基于深度学习的物品制作时间估计方法，利用已有的深度网络特征和新网络fine-tune的方法进行训练，创建了两个包含67,771个衣物图像数据集并且通过实验和应用验证了其在物品时间信息识别和时尚风格计算方面的准确性和性能。

Aug, 2016

注释阴影，亮点和面部：人类参与数字艺术史的贡献

本文研究表明，虽然自动计算技术在数字艺术史中能够揭示新的见解，但人类注释的补充方法更容易发现难以自动检测的细节，人类注释可供数字艺术史研究参考和补充。本研究的注释任务未来还有很大的潜力扩展到数字技术之外的绘画领域。

Sep, 2018

只有时间能告诉我们：发现用于时间建模的时间数据

该研究通过构建一个基于 '时间数据集' 的分类器来研究理解视觉世界如何随时间变化以及在视频理解中，Temporal与Static Action Classes 的区别；并表明更多的时间数据可以帮助提高模型性能。

Jul, 2019

探索 CLIP 用于评估图像外观和感觉

本文介绍了如何利用CLIP模型中的丰富视觉语言先验，以零样本方式评估图像的质量感受和抽象感知，实验结果表明CLIP具有很好的泛化能力。

Jul, 2022

构建多元数字历史的高效OCR

通过对OCR进行字符级图像检索建模，解决了现有体系结构在低资源情况下无法准确识别光学字符识别问题的不足，并为社区参与使数字历史更具代表性开辟了新的途径。

Apr, 2023

利用合成数据生成和基于Transformer的模型提升古籍文档中的物体检测

通过降低虚假阳性和提高精确度的方法，我们在古代文献中增强了物体检测，并通过计算转换生成合成数据集，将视觉特征提取与物体检测过程相结合，进一步关联物体与其组成部分，并引入视觉特征图，从而深入分析和促进了有价值的历史文物，给古文字学领域带来了深远影响。

Jul, 2023

为历史图像数据集创作使用基础模型的文本-图像提示研究

利用基础模型提取历史文献中的图像，并评估不同语言提示对人文学科不同级别的数据集上的效果。

Sep, 2023

PHD: 基于像素的历史文档语言建模

利用基于像素的语言模型对历史文档进行像素遮罩重建，通过生成合成扫描以模拟真实历史文档，展示模型在像素遮罩重建和语言理解能力上的卓越效果，并成功应用于历史问答任务。

Oct, 2023

生成系统在历史摄影管理中的作用：加泰罗尼亚档案案例研究

本研究解决了当前自动摄影管理中的一个问题，即缺乏针对小语言群体的历史档案的标注和描述工具。通过对加泰罗尼亚档案的历史照片进行图像分析，我们提出了一种新颖的方法，通过生成系统定量分析历史资料的描述。研究结果为从业者提供了基于视觉适应和语言接近性的图像标注模型迁移学习工具和方向。

Sep, 2024