Sep, 2018

利用字符和词向量与序列到序列模型进行文本规范化

TL;DR使用字符级别的注意力和事先训练好的子/词级别的嵌入向神经网络提供更多语言学信息,而不需要大量的平行语料库,从而帮助神经网络在标准阿拉伯语语言纠错共享任务数据集上实现最先进的F1分数。