IJCAIMay, 2021

带因果干预的依赖式多任务学习在图像字幕生成中的应用

TL;DR本文提出了一种基于因果干预的依赖多任务学习框架(DMTCI)来解决图像描述生成过程中出现的问题,该框架采用包含类别生成、因果计算和多智能体强化学习策略来提高模型对视觉特征的理解和生成句子的一致性及信息性。实验结果表明,DMTCI 模型优于基准模型,并达到了与最先进模型相媲美的性能。