May, 2023

面向表格和文本混合数值推理的全面解决方案程序化预训练

TL;DR本文提出了三个预训练任务,具体包括:变量完整性排名(Variable Integrity Ranking);变量操作符预测(Variable Operator Prediction);变量关键词屏蔽(Variable Keyphrase Masking)并应用这些任务对数字推理进行建模,结果表明这种方法比基于 Transformer 的模型胜出,对金融报表等表格和文本混合结构进行数字推理具有较高的效果。