检测翻译汉语的句法特征

ACLApr, 2018

Detecting Syntactic Features of Translated Chinese

Hai Hu, Wen Li, Sandra Kübler

TL;DR通过机器学习，利用支持向量机对汉语翻译文本和原生文本进行基于句法特征的区分。通过使用对称的语料库，以短语分析树和依存三元组不带词汇信息特征进行分类，结果表明仅仅用句法特征即可区分出原生汉语和翻译汉语。

Abstract

We present a machine learning approach to distinguish texts translated to Chinese (by humans) from texts originally written in Chinese, with a focus on a wide range of syntactic features. Using →

machine learning chinese translation syntactic features support vector machines corpus

发现论文，激发创造

通过语法依赖和语义意识提高中文故事生成

本文研究生成长篇叙述性内容的故事生成问题，提出了一种新的生成框架，通过依存关系增强机制和同义词去噪训练增强语义表示学习，显著提高了中文故事生成模型性能。

Oct, 2022

中文话语表征结构分析

本文探索了在没有中文标注数据的情况下实现中文语义分析的可行性，描述了线性化的中文意义表示数据的自动收集流程，提出了专为中文语义分析设计的测试套件，阐述了中文语义分析的困难主要是由副词引起的，经实验表明采用机器翻译和英文解析器实现中文语义分析的性能略低于直接在中文数据上训练模型。

Jun, 2023

神经机器翻译中语义现象的自然语言推理评估

本文提出一个过程，用于研究神经机器翻译 (NMT) 系统生成的句子表示如何编码不同的语义现象，最终发现编码器最适合在语法 - 语义界面上支持推理，而不是需要世界知识的指代消解。

Apr, 2018

汉语语言模型中语法知识的受控评估

我们研究了结构化监督在汉语中的效果，结果表明结构化监督可以帮助语言模型学习句法和语义关系，并且在低数据情况下表现出更好的性能。

Sep, 2021

语言输入特征改进神经机器翻译

本文旨在研究如何将语言特征嵌入编码器中以进一步提高神经机器翻译质量，并成功在英语 - 德语和英语 - 罗马尼亚语的神经机器翻译系统中加入了形态特征、词性标签和句法依存标签等语言特征，实验证明这些特征的加入可以显著提高模型的质量。

Jun, 2016

翻译中体裁和方法差异的语言学特征：计算视角

本文利用文本分类方法研究英德翻译语料库的类型和方法变化，使用基于词性标注的特征的组合，包括二元组、三元组和四元组，采用拉普拉斯平滑的贝叶斯分类器。使用分类器的输出对不同类型和翻译方法的主要区别进行了广泛的特征分析。

Sep, 2017

基于依存句法和神经模型的多语言讽刺检测

本研究旨在探讨句法依赖特征在多语言讽刺检测任务中的有效性，并发现句法特征在讽刺检测中是具有信息量的。

Nov, 2020

解释机器翻译语言：神经分类器为何更好，又学到了什么？

通过实验，我们发现神经元模型 BERT 在特定任务下表现更好的原因是其具有更好的特征表示，尤其是与传统手工特征相比。此外，BERT 的高性能也与其对文本主题和错误相关性的学习有关。

Oct, 2022

词汇特征更易受攻击，句法特征具有更强的预测能力

本文研究语言特征的易受攻击性，分析了特征值变化和预测功效变化等两个层面，结果表明词汇特征比句法特征更容易受到攻击，然而句法特征的微小变化却比词汇特征更能影响后续的分类表现。三个数据集的验证证实了这些结果。

Sep, 2019

应用 GCN 结合深度句法和语义知识进行中文序列标注

本文提出了一种新型的桥式结构特征和语义信息的汉语序列标注任务编码框架，并使用图卷积网络对其进行实现，实验结果表明，该模型可以有效提高汉语标注任务的性能。

Jun, 2023