BriefGPT.xyz
大模型
Ask
alpha
关键词
subword embeddings
搜索结果 - 3
ACL
检测西班牙语中的未同化借词:一个带注释的语料库和建模方法
本研究提供了一种新的借词识别资源,并分析了几种模型在此任务上的性能和错误。我们介绍了一个新的西班牙新闻语料库,其中包含 370,000 个标记,用于评估几种序列标记模型(CRF,BiLSTM-CRF 和基于 Transformer 的模型)
→
PDF
2 years ago
ACL
针对无监督神经机器翻译,提升预训练语言模型的词汇能力
本文介绍了一种基于子词嵌入的双语掩码语言模型预训练方法,应用于无监督神经机器翻译和双语词汇归纳任务中均取得了较好的性能表现。
PDF
3 years ago
ACL
基于子词的神经语言模型参数重复利用
本研究提出了利用子单词嵌入和其他权重重用的方法,其中在多层输入嵌入模型中,应从下到上连续捆绑层以在输出时重用,最终建立的最佳词素感知模型在多种语言下可以比竞争的词级模型具有更好的性能且模型参数减少 20%-87%。
PDF
6 years ago
Prev
Next