Sep, 2024

自监督视觉 Transformer 在作家检索中的应用

TL;DR本研究解决了传统作家检索中手工特征和卷积神经网络特征应用不足的问题。我们提出了一种新方法,利用自监督学习从视觉 Transformer 提取特征,并通过 VLAD 编码进行聚合。结果显示,该方法在历史文件集上达到了新的最佳性能,展示了其在现代数据集上的广泛适用性。