Feb, 2022

为视力受损者描述图像的认知和视觉细节:生成包容段落的方法

TL;DR本研究提出一种结合图像分析方法和神经语言模型的方法,结合密集字幕技术和一组筛选器生成网络研讨会图像上下文信息,以生成高度可解释且聚焦于相关信息的描述,以应对视觉障碍个体面临的信息获取问题。