本研究提出了一种新型的神经网络模型,该模型可以同时学习 POS 标记和基于图的依赖解析。该模型使用双向 LSTM 来学习两个任务共享的特征表示,从而解决了特征工程问题。该模型在 19 种语言的通用依赖关系项目上进行了广泛的实验,结果表明我们的模型优于基于神经网络的最新关于 POS 标记和基于转移的依赖解析的程序,从而取得了新的最优性能。
May, 2017
本文提出了一种新的神经网络模型,用于联合部分词性标注和依赖解析,将 BiLSTM 标记组件结合到 BIST 依赖解析器中,可对英语 Penn 语料库进行联合学习,模型在 LUS 和 UAS 评分上分别达到 94.51% 和 92.87%,并在多个评测数据集上都取得了最佳表现。
Jul, 2018
我们首次提出了名为 PhoNLP 的多任务学习模型,可用于联合越南文词性标注、命名实体识别和依存分析,并在越南基准数据集上表现出优秀的效果。我们将 PhoNLP 开源发布作为一个工具包,可直接应用于其他语言的研究和应用中。
Jan, 2021
本文比较了越南语标注未分割文本的两种策略:管道策略和联合策略,并且在特征模型和神经网络模型上进行了比较。经过实验证明,使用管道策略和特征模型时,能更好地识别未分割文本中的词性标记。
Nov, 2017
本文提出了使用基于转移的神经网络联合进行词性标注和依存分析的方法,实现了标签冲突、移位 / 归约冲突和标记冲突的解决。实验表明,我们的方法在各种自然语言的联合词性标注和依存分析方面明显优于之前的方法。
Apr, 2017
本文提出了用于中文分词和词性标注任务的特征丰富的神经模型,使用卷积和池化层模拟传统离散特征模型的特征模板,并结合循环层使用长距离依赖信息。实验结果表明,该模型的效果显著。
Nov, 2016
本文介绍了使用多语言 BERT 嵌入和一些新的神经模型,提高越南语序列标记任务的研究。我们提出了新的模型架构,在 VLSP 2016 和 VLSP 2018 两个命名实体识别数据集和 VLSP 2010 和 VLSP 2013 两个词性标记数据集上进行了广泛评估。我们的方法优于现有方法,并实现了新的最先进结果。
Jun, 2020
本文介绍了神经网络基础工具集 NNVLP,主要用于越南语言处理任务,包括词性标注、分块、命名实体识别。该工具集使用双向长短期记忆网络,卷积神经网络,条件随机场,并使用预训练的词嵌入作为输入,取得了这三个任务的最新成果。我们提供了 API 和 Web 演示。
Aug, 2017
本文提出了一种基于图形的模型来集成中文分词和依赖分析,相较于之前基于转移的联合模型,我们的模型更简洁,从而在中文分词和依赖分析方面取得了更好的性能,并且当结合 BERT 时,我们的模型可以显著减少联合模型和基于黄金分割词的模型之间的性能差距。
Apr, 2019
本研究中,我们使用了 ClearNLP 和 Stanford POS Tagger 这两个广泛使用的工具包,并开发了两个新的越南语 POS 标记器,然后将它们与三个众所周知的越南标记器 JVnTagger、vnTagger 和 RDRPOSTagger 进行比较。通过系统比较,我们发现,利用新特征集构建的越南语标记器可以在标记准确性方面胜过所有其他现有的越南标记器。此外,研究结果还表明,基于转换的标记器 RDRPOSTagger 的运行速度明显快于任何其他统计标记器。
Jun, 2022