Oct, 2023

多元人工智能监督原则的探索

TL;DR使用下一个令牌预测训练大型 Transformer 在人工智能方面取得了突破性进展,但这种生成式人工智能方法严重依赖人类监督,我们提出了一种新的自主生成高质量训练数据的范式 —— 探索型人工智能 (EAI),通过利用大型语言模型在自然语言空间内进行探索达到这一目的。实证评估表明,EAI 显著提升了模型在复杂推理任务上的性能,解决了人类密集监督的局限。