Feb, 2024

视觉去幻化指令生成

TL;DR该文介绍了一种名为 CAP2QA 的生成视觉识别指导的方法,能够显著减少视觉错觉,同时改善视觉识别能力和表达能力。