Mar, 2025

EgoBlind:为盲人提供自我中心视觉辅助的研究

TL;DR本研究提出了EgoBlind,这是首个针对盲人的自我中心视频问答数据集,以评估当代多模态大语言模型的辅助能力。研究发现,现有模型在视觉辅助方面存在显著局限性,准确率仅为56%,远低于人类的87.4%。此工作为未来开发更有效的AI助手提供了重要的基础和改进建议。