IJCAIApr, 2023

适用于视力受损人士的质量不敏感图像字幕技术

TL;DR本文提出了一种质量不受限制的框架,通过数据增强、双网络架构和置信度校准,来提高视障人士图像字幕模型的性能和稳健性,并在与 Royal National Institute of Blind People 合作的辅助生活应用中实现了改进的模型。