通过统计合约激励高质量文本生成

Jun, 2024

通过统计合约激励高质量文本生成

Incentivizing Quality Text Generation via Statistical Contracts

Eden Saig, Ohad Einav, Inbal Talgam-Cohen

TL;DR当前的大型语言模型（LLMs）成功增加了对机器生成文本的需求，然而目前的按令牌计费模式存在一种经济学上称为道德风险的激励错位：生成文本的代理有强烈的动机通过偏好更便宜的模型来降低成本，并且这可以在内部执行推理的过程中完成。我们从经济学角度提出了一种以绩效为基础的以合同为基础的框架来解决这个问题。通过研究代理生成文本的贵重推理过程，并以自动质量评估来决定合同确定主体根据文本支付的金额，我们研究了一个主体-代理博弈。由于标准合同理论无法适用于不知道内部推理成本的情况，我们引入了成本-稳健合同。作为我们的主要理论贡献，我们通过与统计学中最优复合假设检验的直接对应关系，对成本-稳健合同进行了表征，推广了Saig等人的研究（NeurIPS'23）的结果。我们通过为一系列目标和LLM评估基准推导合同来实证评估我们的框架，并发现与成本意识的合同相比，成本-稳健合同只需要微不足道的目标价值增加。

Abstract

While the success of large language models (LLMs) increases demand for machine-generated text, current pay-per-token pricing schemes create a misalignment of incentives known in economics as moral hazard: Text-ge

发现论文，激发创造

ContractNLI: 合同文件级别自然语言推理数据集

本研究提出了一种新的自然语言推理应用——针对合同的“文档级自然语言推理”，解决了合同审查过于耗时和过于昂贵的问题，并标注并发布了目前最大的包括607个合同的语料库。研究还指出，以往的模型在该任务上表现不佳，而研究者引入了一种新的算法，并通过多标签分类和更复杂的上下文分割方法使该任务取得了显著进展，并认为这一领域还有很大的改进空间。

Oct, 2021

创作者经济中的线上学习

本文探讨创作者经济中的在线学习，通过将创作者经济建模为用户、平台和内容创作者之间的三方博弈，分析并比较基于回报和基于特征两类契约，同时优化推荐策略，以期最大化效用。

May, 2023

生成语言模型和影响操作的成本分析

大型语言模型对宣传者在内容生成成本方面提供可观的节省，并在影响操作中具有潜在的减少成本的能力。

Aug, 2023

生成解释

利用大型语言模型，引入了生成式解释的新方法来估计合同的含义。在地面案例研究的基础上，展示了这些新工具在不同方面的能力，如协助查明上下文中的普通含义、量化模棱两可性和填补各方协议中的空白。提供了使用这些模型的最佳实践并考虑了它们对司法实践和合同理论的影响。生成式解释可以廉价而准确地预测当事方的意图，解决当前解释僵局，并满足成本和确定性以及准确性和公平性之间的平衡。因此，我们认为生成式解释有望成为合同解释的新工具。

Aug, 2023

LLM的谈判能力评估：基准与买方增强方法

描述并量化了LLM驱动代理在具有不完全信息的买卖任务中的议价能力，并通过提出一种集成了确定性商品生成器和自然语言生成器的新方法OG-Narrator来提高买家的交易成功率和利润。

Feb, 2024

网络合同设计的新视角：异质、同质、非近视代理人和团队生产

该论文主要研究了在线学习视角下的重复主体-代理问题，研究了当主体每轮与单个代理进行合同交互时的三种不同情境，并提出了不同的方法和技术来设计学习算法。此外，还研究了团队生产模型，并提出了一种有效找到最优合同的方法。

Mar, 2024

大型语言模型的算法勾结

通过对大型语言模型（LLMs）以及具体的GPT-4算法进行定价任务实验，我们发现LLM算法定价代理在垄断市场中自主勾结，对消费者造成不利影响，并且LLM指令中表面无关短语的变化可能增加勾结行为，这些结果同样适用于拍卖设置，凸显了需要针对算法定价实施反垄断法规的必要性，揭示了基于LLM的定价代理面临的独特监管挑战。

Mar, 2024

生成AI版权挑战的经济解决方案

Apr, 2024

对齐语言模型中的基本权衡及其与采样适配器的关系

使用Reinforcement Learning through Human Feedback (RLHF)与probability-quality relationship方法，我们研究了语言模型对文字生成系统的影响，并提出了适应模型选择的采样适配器。

Jun, 2024

利用大型语言模型从文本保单生成智能健康保险合同

利用大型语言模型（LLMs）从基于文本的政策中生成应用程序代码，以自动化健康保险流程，目标为基于区块链的智能合约。

Jul, 2024