检测翻译汉语的句法特征
本文研究生成长篇叙述性内容的故事生成问题,提出了一种新的生成框架,通过依存关系增强机制和同义词去噪训练增强语义表示学习,显著提高了中文故事生成模型性能。
Oct, 2022
本文探索了在没有中文标注数据的情况下实现中文语义分析的可行性,描述了线性化的中文意义表示数据的自动收集流程,提出了专为中文语义分析设计的测试套件,阐述了中文语义分析的困难主要是由副词引起的,经实验表明采用机器翻译和英文解析器实现中文语义分析的性能略低于直接在中文数据上训练模型。
Jun, 2023
本文提出一个过程,用于研究神经机器翻译 (NMT) 系统生成的句子表示如何编码不同的语义现象,最终发现编码器最适合在语法 - 语义界面上支持推理,而不是需要世界知识的指代消解。
Apr, 2018
本文旨在研究如何将语言特征嵌入编码器中以进一步提高神经机器翻译质量,并成功在英语 - 德语和英语 - 罗马尼亚语的神经机器翻译系统中加入了形态特征、词性标签和句法依存标签等语言特征,实验证明这些特征的加入可以显著提高模型的质量。
Jun, 2016
本文利用文本分类方法研究英德翻译语料库的类型和方法变化,使用基于词性标注的特征的组合,包括二元组、三元组和四元组,采用拉普拉斯平滑的贝叶斯分类器。使用分类器的输出对不同类型和翻译方法的主要区别进行了广泛的特征分析。
Sep, 2017
通过实验,我们发现神经元模型 BERT 在特定任务下表现更好的原因是其具有更好的特征表示,尤其是与传统手工特征相比。此外,BERT 的高性能也与其对文本主题和错误相关性的学习有关。
Oct, 2022
本文研究语言特征的易受攻击性,分析了特征值变化和预测功效变化等两个层面,结果表明词汇特征比句法特征更容易受到攻击,然而句法特征的微小变化却比词汇特征更能影响后续的分类表现。三个数据集的验证证实了这些结果。
Sep, 2019
本文提出了一种新型的桥式结构特征和语义信息的汉语序列标注任务编码框架,并使用图卷积网络对其进行实现,实验结果表明,该模型可以有效提高汉语标注任务的性能。
Jun, 2023