Oct, 2022

解决数学应用题的自洽推理方法

TL;DR通过采用自我一致性推理框架 SCR,其中利用修剪策略来纠正输入文本和输出表达式之间的虚假相关样本,进而通过对称的 Kullback-Leibler 分歧来校准输出分布偏移,SCR 生成等效表达式,并在两个大型基准实验中表现出优越性。