Apr, 2024

FedEval-LLM:基於集體智慧的對下游任務進行大型語言模型的聯邦評估

TL;DR提出了一种名为 FedEval-LLM 的大型语言模型联邦评估框架,通过利用参与者提供的个性化语言模型,提供了一种可靠的大型语言模型在下游任务中的性能测量方式,确保了强大的隐私保护能力,解决了传统评估方法和对外部服务的依赖性的限制,是协作训练场景中语言模型评估的一种有前景的框架。