Nov, 2022

GAMMT:使用多个 Transformer 进行生成性歧义建模

TL;DR介绍了一种基于概率集的序列数据模型 GAMMT,运用多重变压器连接机制处理模糊的概率,以多种方式表示输入令牌和输入序列,探索了注意力机制和模糊性的组合作用,通过深度神经网络实现模糊性建模,为机器学习的新研究提供框架,提高我们对关注度 - 模糊机制的理解。