Mar, 2024

ROUTERBENCH:多层逻辑系统的基准测试

TL;DR提供了ROUTERBENCH评估框架和数据集,该框架可系统评估LLM路由系统的效力并比较各种路由方法的潜力和局限性,进一步推动了LLM路由系统的发展和评估标准的确立。