BriefGPT.xyz
Ask
alpha
关键词
low vision
搜索结果 - 2
VisPercep:一种增强视觉感知能力的视觉语言方法(面向盲人和视力障碍人群)
本文提出了一种创新的方法,利用大型视觉语言模型增强盲人和视力低下人士的视觉感知,提供周围环境的详细综合描述并警示潜在风险。该方法通过整合图像识别结果和用户查询,使用大型视觉语言模型根据提示生成环境的详细描述,并通过分析环境对象和场景来识别潜
→
PDF
8 months ago
ICCV
Trans4Trans: 用于透明物体分割的高效 Transformer,帮助视力障碍者在现实世界中导航
提出 Trans4Trans 模型,利用双头转换器来分割常见的全玻璃幕墙、透明物体,进行实时的辅助导航,有效提升低视力人士的行动能力。模型基于对称变压器编码器和解码器,花费较少计算复杂度,可在可携带的 GPU 上轻松部署。在 Stanfor
→
PDF
3 years ago
Prev
Next