Apr, 2023

REFINER: 在中间表示上进行推理反馈

TL;DR以 REINFER 为框架,使用自动化反馈的机器模型来有针对性地改善语言模型在推理任务中的表现。实验证明,在三个不同的推理任务中,REFINER 表现明显优于同等规模的基线语言模型。