Jan, 2024

优化 LLM 使用成本的探索

TL;DR本研究提出了一种通过预测 LLMs 的输出质量并优化选择 LLMs 的模型和算法,以降低使用成本,并在质量和延迟意识的情况下实现成本和质量的折衷。研究表明,我们的方法在降低成本 40%-90% 的同时,提高了质量 4%-7%。