BriefGPT.xyz
Mar, 2024
斯拉夫语跨语言命名实体语料库
Cross-lingual Named Entity Corpus for Slavic Languages
HTML
PDF
Jakub Piskorski, Michał Marcińczuk, Roman Yangarber
TL;DR
该研究论文介绍了一个手动注释的语料库,包含六种斯拉夫语言的命名实体。该研究使用基于Transformer的神经网络架构和预训练的多语言模型进行命名实体识别和分类,以及命名实体的词形还原和链接。
Abstract
This paper presents a
corpus
manually annotated with
named entities
for six
slavic languages
- Bulgarian, Czech, Polish, Slovenian, Russia
→