BriefGPT.xyz
Ask
alpha
关键词
language families
搜索结果 - 4
通过句法距离和地理邻近性探索语言关系
使用基于词性标注的三元组来计算语言间的语言距离,发现语言之间存在明确的族群和组群,且语言之间的相似性与地理距离呈显著相关。
PDF
3 months ago
EMNLP
使用 Fisher 信息矩阵在多语言翻译模型中聚类伪语系
通过使用费舍尔信息矩阵(FIM)将语言家族进行聚类,我们提出了一种创新的方法来解决多语言翻译模型训练阶段数据集变化所带来的挑战,并定义了伪语言家族。实证评估结果显示,采用这些伪语言家族能够在适应陌生语言对的多语言翻译模型中提高性能,该方法也
→
PDF
7 months ago
跨语言语料库相似度度量方法具有较强的鲁棒性
本文通过注册预测任务在 39 种语言中实验了基于频率的语料库相似度测量方法,旨在量化各语言语料库之间的距离和单个语料库的同质性,结果表明这些测量方法可以在不同语系、写作系统和形态类型的情况下保持有效性,并且可以应用于低资源语言和不同的语料库
→
PDF
2 years ago
零样本跨语言辱骂语言检测的转换语言选择
通过研究语言相似度对自动恶意语言检测的转移学习进行语言选择,为低资源语言构建更好的检测系统,实现零 - shot 检测。通过量化语言结构的世界地图,发现语言相似度与分类器性能之间存在相关性,进而选择最佳转移语言。
PDF
2 years ago
Prev
Next