Nov, 2018

使用集成方法对专利申请进行分类

TL;DR使用 ALTA 2018 共享任务提供的已注释数据集,我们提供了自动分类专利申请的方法。通过多种方法的测试,利用 SVM 集成使用单词和字符组合作为特征,最佳结果在 14 支队伍中排名第一的 0.778 微平均 F1 - 值实现了将专利申请按照基于国际专利分类(IPC)的粗粒度分类法分为八个类别的目标。