Aug, 2023

面向盲人和视障人士的实时自我的运动段落字幕生成在 RGB-D 影院图像中的研究

TL;DR通过图像字幕和分割,本研究提出了一种帮助盲人和视觉受损人士了解和重建环境的方法,该方法提供了与他们相关的区域和对象的位置描述(左、右、前),以及区域之间的位置关系,通过将解决方案应用于 TS-RGBD 数据集,旨在帮助他们访问戏剧表演。