Jun, 2024

通过统计合约激励高质量文本生成

TL;DR当前的大型语言模型(LLMs)成功增加了对机器生成文本的需求,然而目前的按令牌计费模式存在一种经济学上称为道德风险的激励错位:生成文本的代理有强烈的动机通过偏好更便宜的模型来降低成本,并且这可以在内部执行推理的过程中完成。我们从经济学角度提出了一种以绩效为基础的以合同为基础的框架来解决这个问题。通过研究代理生成文本的贵重推理过程,并以自动质量评估来决定合同确定主体根据文本支付的金额,我们研究了一个主体-代理博弈。由于标准合同理论无法适用于不知道内部推理成本的情况,我们引入了成本-稳健合同。作为我们的主要理论贡献,我们通过与统计学中最优复合假设检验的直接对应关系,对成本-稳健合同进行了表征,推广了Saig等人的研究(NeurIPS'23)的结果。我们通过为一系列目标和LLM评估基准推导合同来实证评估我们的框架,并发现与成本意识的合同相比,成本-稳健合同只需要微不足道的目标价值增加。