Jun, 2024

FamiCom: 评估任务无关性能的语言模型提示的进一步解谜

TL;DR通过使用 FamiCom 这一修订度量,结合语言模型对提示的熟悉度以及任务的复杂性,能够更准确地估计任务无关性能,并在自动提示和演示选择方面的准确性方面超过了现有方法和基准超过 7.0%。