May, 2024

一个优化 AI 工作负载的声明性系统

TL;DRPalimpzest 是一个系统,它通过在一个声明性语言中定义查询来使任何人能够处理基于人工智能的分析查询。系统使用其成本优化框架来实现查询,在运行时间、财务成本和输出数据质量之间实现最佳权衡。该系统在法律发现、房地产搜索和医疗模式匹配等任务上展示了各种吸引人的计划,包括比基准方法更快 3.3 倍、更便宜 2.9 倍,并提供更好的数据质量的计划。与单线程的 GPT-4 基准相比,通过启用并行性,Palimpzest 可以以最多 90.3 倍的加速度、9.1 倍较低的成本获得 83.5% 的 F1 分数,而且不需要用户额外的工作。