Apr, 2022

利用 Transformers 自然语言处理方法对巴西法院文件进行相似性聚类

TL;DR本研究运用 BERT、GPT-2 和 RoBERTa 等 6 种转换器以及 21 万份法律诉讼专业化训练模型,通过将文件预处理十分相似的信息转化为向量、使用无监督学习方法聚类控制进行法律领域的词语判定,体现出转换器模型的优点。在这其中,RoBERTa 模型得到了进一步发展,成为了本研究的重要部分。