Oct, 2024

未来标记预测——基于每个标记语义状态向量的因果语言建模用于多标记预测

TL;DR本研究解决了生成语言模型在单一标记预测中可能忽略序列整体含义的问题。提出了一种新的预训练方法——未来标记预测(FTP),通过生成每个标记位置的嵌入向量,改进了长文本序列的整体语义捕捉。研究发现,FTP模型生成的文本在主题连贯性和文本分类上均优于传统的GPT模型。