AAAIDec, 2023

值得信赖的视觉语言模型的探险:一项调查

TL;DR通过三个基本原则(偏见、鲁棒性和可解释性)对视觉 - 语言变压器进行深入研究,以提高它们的可靠性和可信度。