Mar, 2024

扩张模型中的语义分割的词汇开放式注意力图与令牌优化

TL;DR通过 Open-Vocabulary Attention Maps (OVAM) 方法,我们提出了一种基于迁移学习的模块 (Nucleus) 来训练大规模的中文文本生成系统 TextGPT,该模型利用 Transformer 将初始输入句子转换成生成句子所需的上下文嵌入向量,然后基于这些上下文嵌入生成生成句子。