Jan, 2022

法律领域中以数据为中心的机器学习

TL;DR探究数据集大小、训练数据集和测试数据集的划分、人工标注标签准确性等对深度学习分类器性能的影响,指出类的语义同质性会影响分类的难度,并讨论数据集属性评估的建立方法以及数据集增强可以作为提高 AI&Law 各种任务分类性能的另一条途径。