May, 2024

利用人工修订改进文本布局模型

TL;DR通过利用人类修订技巧,本研究提出了利用细致反馈的奖励模型的方法,以加强生成模型的对齐性和性能。