Nov, 2023

(为什么) 我的提示越来越差?重新思考演进中的 LLM API 的回归测试

TL;DR基于我们对毒性检测的案例研究,我们强调了对不断演化的 LLM API 进行回归测试的必要性,并重新审视了传统测试方法的基本变化需求,因为 LLM API 具有不同的正确性概念、易碎性和非确定性。