Jul, 2024

测量语言模型创造力:代码生成案例研究

TL;DR对LLMs的创造力进行量化和评估的研究,通过引入Denial Prompting和NeoGauge度量,发现即使是最具创造力的模型GPT-4仍远远落后于展现人类创造力的水平。