Sep, 2023

基于众包图像实现大规模建筑属性映射:Flickr 中的场景文本识别及待解决问题

TL;DR通过 Flickr 图像数据集,在众包平台上使用先前训练好的场景文本识别模型实现建筑属性映射,研究了街景图像中应用场景文本识别的挑战,发现了与该任务相关的问题和挑战,并提出发展不仅限于城市热点区域的城市范围内的映射,同时建议跨学科合作以了解建筑摄影和标注背后的动机。