Mar, 2024

宪政专家:培训基于原则的提示的混合方法

TL;DR通过逐步编辑单独原则的方式,我们的研究引入了 ConstitutionalExperts 方法,该方法可学习构成原则的提示,与其他最新的提示优化技术相比,我们的方法在六个基准数据集上取得了 10.9%(F1)的优势,并且混合专家模型可以改进所有技术,表明其广泛适用性。