使用超标签特征的越南语基于转换的依存分析
本文比较了不同的依赖关系解析器对于越南语的表现,实验结果显示基于神经网络的解析器显著优于传统解析器,在标注和未标注附着得分上分别达到了 73.53% 和 80.66%,是目前公布的越南语最高的解析得分。
Nov, 2016
本研究探讨了在贪婪的基于转移的依存解析中使用丰富的超级标记特征的影响。通过为单词添加 Continue Vector representation of the entire supertag distribution 已经取得了最佳结果,通过在英语 Penn Treebank 上对 Stanford Dependencies 进行转化,最终实现了具有 88.6% LAS 和 90.9% UAS 的超级标记功能的贪婪基于转移的解析。
Jul, 2020
本研究中,我们使用了 ClearNLP 和 Stanford POS Tagger 这两个广泛使用的工具包,并开发了两个新的越南语 POS 标记器,然后将它们与三个众所周知的越南标记器 JVnTagger、vnTagger 和 RDRPOSTagger 进行比较。通过系统比较,我们发现,利用新特征集构建的越南语标记器可以在标记准确性方面胜过所有其他现有的越南标记器。此外,研究结果还表明,基于转换的标记器 RDRPOSTagger 的运行速度明显快于任何其他统计标记器。
Jun, 2022
本文比较了越南语标注未分割文本的两种策略:管道策略和联合策略,并且在特征模型和神经网络模型上进行了比较。经过实验证明,使用管道策略和特征模型时,能更好地识别未分割文本中的词性标记。
Nov, 2017
本文提出了使用基于转移的神经网络联合进行词性标注和依存分析的方法,实现了标签冲突、移位 / 归约冲突和标记冲突的解决。实验表明,我们的方法在各种自然语言的联合词性标注和依存分析方面明显优于之前的方法。
Apr, 2017
本研究针对语义解析这一重要的自然语言处理任务,提出了针对越南语的首个公共大规模 Text-to-SQL 语义解析数据集,并在该数据集上评估了两种强大的语义解析基线,通过比较不同配置条件发现自动越南语词语分割、来自越南神经依存句法分析器的潜在句法特征等都能够有效提高语义解析的匹配度,而针对越南语的单语言模型 PhoBERT 更胜于近期最佳的多语言模型 XLM-R。
Oct, 2020
本文提出了一个新的多任务学习模型,用于联合越南语词语分割、词性标注和依存句法分析,并在越南基准数据集上进行了实验,结果表明本模型具有最先进或竞争性的表现。
Dec, 2018
本文介绍了使用多语言 BERT 嵌入和一些新的神经模型,提高越南语序列标记任务的研究。我们提出了新的模型架构,在 VLSP 2016 和 VLSP 2018 两个命名实体识别数据集和 VLSP 2010 和 VLSP 2013 两个词性标记数据集上进行了广泛评估。我们的方法优于现有方法,并实现了新的最先进结果。
Jun, 2020
通过使用 pointer networks 实现的转移句法分析器在依赖句法分析方面已经成为最新的技术水平,我们提出了一种基于指针网络的转移系统,可以直接生成标记有方向无环图并实现语义依赖分析。同时,我们使用从 BERT 提取的深层上下文化的词嵌入来增强我们的方法。这一结果不仅超越了所有现有的基于转移的模型,而且还匹配了 SemEval 2015 任务 18 英语数据集上先前最先进的基于图形的解析器的最佳完全监督准确率。
May, 2020
本论文利用双向长短时记忆(Bi-LSTM)神经网络结合自动语法特征和词嵌入,提出了一种越南命名实体识别系统,其在 2016 年由越南语言与语音处理社区(VLSP)组织的评估中实现了 92.05%的综合 F1 分数,远超过先前的命名实体识别系统。
May, 2017