Nov, 2022

通过跨模态梯度协调扩展多模态预训练

TL;DR本文讨论了跨模态对齐的效果和问题,提出了通过梯度调整和基于梯度的课程学习解决梯度冲突的方法,并将其应用于视频音频文本模态的预训练中以提高性能。