BriefGPT.xyz
Ask
alpha
关键词
blind and visually impaired
搜索结果 - 3
AltChart: 多预训练任务提升基于 VLM 的图表摘要
图表概括对于盲人和视障人士来说是一项至关重要的任务,因为它是他们获取和解释图形数据的主要手段。本研究提出了三个关键贡献:引入了 AltChart 数据集,提出了一个新的预训练视觉语言模型的方法,以及对四种主流图表概括模型进行了全面评估。
PDF
2 months ago
面向盲人和视障人士的实时自我的运动段落字幕生成在 RGB-D 影院图像中的研究
通过图像字幕和分割,本研究提出了一种帮助盲人和视觉受损人士了解和重建环境的方法,该方法提供了与他们相关的区域和对象的位置描述(左、右、前),以及区域之间的位置关系,通过将解决方案应用于 TS-RGBD 数据集,旨在帮助他们访问戏剧表演。
PDF
10 months ago
DRISHTI:视障人士的视觉导航助手
本文介绍了一种名为 DRISHTI 的新型可穿戴助听设备,它由摄像头模块、ESP32 处理器、蓝牙模块、智能手机和扬声器组成,利用人工智能检测和了解用户路径以及路径前方的障碍物,然后通过语音输出向视障用户提供导航帮助,旨在实现视障人士的自主
→
PDF
a year ago
Prev
Next