Feb, 2023

利用任务奖励调整计算机视觉模型

TL;DR采用强化学习技术将计算机视觉模型与任务奖励对齐,以解决复杂结构输出的误差问题,在多个计算机视觉任务中(对象检测,全景分割,着色,图像字幕)都显示出惊人的有效性。这种方法有望广泛用于使模型更好地与各种计算机视觉任务对齐。