May, 2023

MultiLegalSBD: 多语种法律句子边界检测数据集

TL;DR本文介绍了一个基于多语言法律数据集的句子边界检测研究,展示了基于 CRF、BiLSTM-CRF 和 transformers 的单语和多语模型在该任务上的最新性能,并在葡萄牙语测试集的零样本情况下,证明了其多语模型的性能优于所有基线模型。