Nov, 2022

统一多模态模型结合非可能训练用于视觉对话

TL;DR本文提出了一种名为UniMM-UL的统一多模态模型,它使用Unlikelihood Training方法来探索负样本中使用的有用知识,具有比先前工作更好的生成结果和与最先进技术相媲美的区分结果,并支持视觉对话理解和生成的多任务学习。