Feb, 2024

通过可扩展的监督和集成学习提高从弱到强的泛化能力

TL;DR本文是对OpenAI最近关于弱到强泛化(W2SG)的超对齐工作的跟进研究,并提出使用集成学习和弱到强监督实现过强人工智能模型开发和超智能进化的方法。通过人类监督和自动对齐评估器来增强弱监督的能力,实现了弱到强监督的目标,并讨论了改进弱监督对于增强弱到强泛化的影响。