Nov, 2023

BizBench:商业和金融的定量推理基准

TL;DR评估金融推理能力的基准和挑战性问题 BizBench,通过三个财务领域的代码生成任务对大型语言模型进行了全面深入的评估,并表明 BizBench 是金融和商业领域量化推理的一个具有挑战性的基准模型。