Jan, 2023

基于 BERT 的罗马尼亚语数据集 ROST 的作者归属

TL;DR使用预训练的语言模型 BERT 来检测罗马尼亚语文本的作者,虽然数据集不平衡,但结果比预期好,有时超过 87%的宏平均精度。