Nov, 2023
GPT-Neo 大型语言模型仿真语料中的 Heaps' Law
Heaps' Law in GPT-Neo Large Language Model Emulated Corpora
Uyen Lai, Gurjit S. Randhawa, Paul Sheridan
TL;DR本研究验证了 Heaps' law 在大型语言模型生成的文本中的适用性,并发现随着模型大小的增长,生成的词汇越来越符合 Heaps' law。未来的研究应重点关注增加模型大小或改进模型架构以提高 GPT-Neo 产生的输出的丰富性和真实性。