Jan, 2024

合适的模型:法律多标签分类基线的评估

TL;DR在这项工作中,我们使用两个公共法律数据集 POSTURE50K 和 EURLEX57K,通过改变训练数据量和标签数量,评估了不同的多标签分类方法,结果显示 DistilRoBERTa 和 LegalBERT 在法律多标签分类中表现良好,而 T5 在生成模型中表现相当,并且 CrossEncoder 在提高宏 F1 分数方面具有潜力,尽管计算成本增加。