Oct, 2022

内视力:基于模拟的基础语言模型推理

TL;DR研究通过使用计算物理引擎作为输入,将语言模型中的推理过程与现实社会有机结合,让模型具有更加精准有效的推理能力,以达到人类与 AI 之间成功和有效的交流。该研究的实验证明 Mind's Eye 可以在物理对齐基准测试中改善模型推理能力 27.9%(零击中率)和 46.0%(少量击中率),较小的语言模型具有 Mind's Eye 也能获得类似的性能。