Sep, 2023

赋能视障人士:苹果实时照片和安卓动态照片的新应用

TL;DR我们介绍了一种评估和对比 Live/Motion 照片与传统基于图像的方法在视觉辅助任务中的有效性的简单方法,并发现 Live 照片和运动照片在常见视觉辅助任务中,特别是物体分类和 VideoQA 中,优于单帧图像。通过在视障个体采集的视频组成的 ORBIT 数据集上进行了大量实验验证了我们的结果。此外,我们进行了一系列的消融研究,以深入研究去模糊和较长时间剪辑的影响。