BriefGPT.xyz
Ask
alpha
关键词
lexical representation
搜索结果 - 5
ACL
多语言语言建模中的分词影响:评估跨语言词汇分配和重叠
本文提出新的标准以评估子词符号化器中的词汇表示质量和词汇重叠度,并发现跨语言单词表的重叠实际上可能对某些下游任务(如 POS、依赖树标记)产生负面影响,而在命名实体识别和句子级任务(如跨语言检索、NLI)中分享词汇表是有益的。此外,本文还观
→
PDF
a year ago
ACL
通过定义生成可解释的词义表示:以语义变化分析为例
利用自动生成的自然语言定义,将上下文单词用法作为可解释的词和词义表示。使用 Flan-T5 语言模型生成每个用法的定义,从用法簇中选择最典型的定义作为词义标签,可在语义变化分析中进行应用。此外,上下文定义在 NLP 中的单词语境语义相似性判
→
PDF
a year ago
具有风格意识的神经模型及其在作者归属方面的应用
本文提出了一种样式感知神经模型,以从三个样式水平对文档信息进行编码,并在作者归属领域进行评估,实验结果表明,相对于文献中的基线方法,从所有三个样式水平编码文档信息具有显著的优势,实验数据来源于四个基准数据集。
PDF
5 years ago
EMNLP
低资源神经机器翻译元学习
本文利用元学习算法 (MAML) 扩展低资源 NMT 问题,并通过多语言高资源任务进行学习来适应低资源语言,并利用全局词汇表解决不同语言的输入输出错配, 在使用 18 种欧洲语言作为源任务和 5 种不同的语言作为目标任务的情况下,相对于基于
→
PDF
6 years ago
ACL
极低资源语言通用神经机器翻译
本文介绍了一种针对数据有限的语言的新的通用机器翻译方法,利用迁移学习的方法,在多源语言之间共享词汇和句子级别的表示,从而帮助低资源的语言利用高资源语言的词汇和句子表示,在罗马尼亚语 - 英语 WMT2016 上,我们的方法在 6k 的平行语
→
PDF
6 years ago
Prev
Next