Jun, 2024

量化 LLM 对提示工程的敏感性和一致性:我做错了什么?

TL;DR使用两个度量标准(敏感性和一致性)来评估大型语言模型在分类任务中的性能,并希望它们能成为自动提示工程框架中寻求平衡鲁棒性与性能的有力工具。