Jun, 2023

用于长文本建模的循环注意力网络

TL;DR本文提出了一种新型深度学习神经网络 RAN,采用自注意力机制和递归结构相结合的方法,实现了在长文本处理中的可重复性操作,对文本进行建模提取全局语义信息,并能兼容顺序和分类任务。实验结果表明,RAN 模型具有出色的编码能力,适用于长文本语义的自动提取和处理。