Aug, 2023

FoodGPT:一种在食品测试领域的大型语言模型,采用增量预训练和知识图谱提示

TL;DR现有的大规模语言模型建设通常是在基础模型上进行微调,有些模型还会融入知识库而不需要预训练。本文提出了一种增量预训练方法来处理结构化知识和扫描文档,通过构建知识图谱作为外部知识库,旨在解决大规模语言模型中的机器幻觉问题。