概念语言相似性的研究：比较与评估

May, 2023

概念语言相似性的研究：比较与评估

A study of conceptual language similarity: comparison and evaluation

Haotian Ye, Yihong Liu, Hinrich Schütze

TL;DR本研究旨在将语言学的特性纳入到自然语言处理（NLP）中，通过基于基本概念的表示来定义语言之间的相似性并将其应用于二元分类任务中的低资源语言研究。

Abstract

An interesting line of research in natural language processing (NLP) aims to incorporate linguistic typology to bridge linguistic diversity and assist the research of →

natural language processing linguistic typology low-resource languages conceptual similarity binary classification task

发现论文，激发创造

1335 种语言中的跨语言概念化研究

使用 Conceptualizer 方法对 1335 种语言中 83 个概念做出对齐，并且证明具有概念的跨语言稳定性，提出了一种语言之间的概念相似度的方法。

May, 2023

自然语言处理和心语言学的桥梁：计算基础的巴斯克语和西班牙语语义相似性和关联数据集

本文介绍了一个基于 NLP 资源的语义相似性数据集，用于填补心理语言学研究中的空白，并通过提供大量受词汇处理中起重要作用的变量控制的名词对的语义相似性的各种量化方式。

Apr, 2023

语言变异和语言规律的建模：关于自然语言处理中的语言类型学调查

对语言类型学在自然语言处理中的应用进行了调研，发现目前的语言类型数据库在系统性能提升方面存在局限性，现提出将语言的类型类别与现代自然语言处理中的机器学习算法相融合的新方法。

Jul, 2018

语言表征实际代表着什么？

本文研究表明神经语言模型在多语言语料库上的训练可以用来学习语言的分布式表示，尤其是在语料库被翻译成英文的情况下。我们研究了语言表示与各种相似性之间的相关性和因果关系，发现结构相似是最能影响语言表示相似性的，而遗传关系则是一个混淆因素。这项研究可以促进自然语言处理和语言学的相互发展。

Jan, 2019

评估基于 Transformer 的多语言文本分类

研究探讨了 NLP 工具在不同语言的应用情况以及针对语言结构差异进行的分析，指出哪些变量最影响语言建模的效果，通过计算词序和形态相似性指数等方法进行实证研究，最后通过多分类文本分类实验验证了研究结论。

Apr, 2020

自然语言处理中的 ' 类型多样性 ' 是什么？

本研究系统地调查了涉及 “类型多样性” 的自然语言处理研究，发现并无固定的定义或标准。我们引入了几种度量标准来近似衡量语言选择的多样性，发现结果在各篇论文中差异很大。此外，我们证明了偏斜的语言选择可能导致对多语言性能的高估。我们建议未来的研究应当在 “类型多样性” 方面提供清晰的操作定义，以从经验证据上证明语言样本的多样性。

Feb, 2024

语义相似度的演化 -- 综述

本文旨在全面概述自然语言处理领域中语义相似度计算的研究现状和各种方法及其优劣，将其归类为基于知识、基于语料库和基于深度神经网络等不同原理的方法，并希望能够促进新研究者的创新思路和实验。

Apr, 2020

利用语言相似性进行零样本跨语言转移语言选择

研究使用语言相似性来选择最佳的迁移语言，从而提高在情感分析、命名实体识别和依赖解析等不同自然语言处理任务中的跨语言迁移性能。

Jan, 2023

自然语言和本体分析的语义相似性

本书主要介绍语义相似度估计及其它语义度量学科的两种最先进的方法：自然语言处理技术和语义模型以及基于语义网络、词库或本体论的计算机可读的知识形式。它的目的是为初学者和研究人员提供更好地理解语义相似度估计和更一般的语义度量。

Apr, 2017

语义相似度度量方法的描述和评估

这篇论文介绍了基于结构、信息内容和特征的语义相似度测量方法，并针对两个标准基准进行了分类和评估，目的是为研究人员和从业者选择适合其要求的最佳度量提供有效的评估。

Oct, 2013