Mar, 2023

CTRAN:基于 CNN-Transformer 的自然语言理解网络

TL;DR本研究提出了基于 CTAN(一种新型 encoder-decoder CNN-Transformer-based 结构)的自然语言理解方法,它在使用 BERT 编码器后、多个卷积层之后使用窗口特征序列重新排列输出,并在窗口特征序列之后使用堆叠的 Transformer 编码器。在意图检测解码器中,使用自我注意力和一个线性层,在填充槽解码器中,引入对齐 Transformer 解码器。结果表明我们的模型在 ATIS 和 SNIPS 中对填充槽任务超过了目前的最优。另外,研究还表明将语言模型作为单词嵌入优于将其作为编码器。