Dec, 2023

深度 de Finetti:从大型语言模型中恢复主题分布

TL;DR使用大型语言模型,我们发现它们能够生成结构完整且连贯的长文本,表明虽然这些模型是基于下一个词的预测进行训练的,但它们必须表示文档的潜在结构。本文研究了潜在主题结构作为文档结构的互补方面,通过将大型语言模型优化与隐性贝叶斯推断相连接来验证我们的假设。我们通过拉普拉斯诱导的神经概率编码机制与连续下降信息论方法推导出来自大型语言模型的统计学抽象,进而通过推导来自大型语言模型的统计学抽象。