Sep, 2022

提升视觉问答中的跨语言泛化能力

TL;DR本研究探讨了多语言视觉语言模型在跨语言环境中表现欠佳的情况,并提出了三种策略以提高它们在零-shot跨语言视觉问答任务中的性能。实验证明,该Fine-tuning策略取得了一致的效果。