使用 Modified D2SBERT 和 Sentence Attention 机制进行人工智能相关专利的多标签分类
本文使用词向量和深度学习技术研究专利分类的任务,并尝试使用不同的特征表示和基于专利文件不同部分的集成分类器。结果表明,与目前最先进的独立解决方案相比,分类器的集成架构显著优于独立解决方案。
Mar, 2022
本文提出了一种基于预训练 BERT 模型微调的专利分类方法,使用专利权利要求单独进行分类,与使用 CNN 的词嵌入相比,性能优于现有方法,在 CPC 子类水平上提供了一个大型 USPTO-3M 数据集。
May, 2019
专利及技术知识管理中的先进语言处理和机器学习技术承诺大规模效率改进。本文系统概述了与专利相关的任务和流行的方法,并着重介绍了发展中和有前景的技术。该研究表明,语言处理和特别是大型语言模型以及最近普遍应用的生成方法有望成为专利领域的颠覆者。然而,专利领域存在一些技术困难,现有模型难以解决。通过指出关键进展、机会和差距,我们旨在鼓励进一步研究,加速该领域的发展。
Mar, 2024
最近人工智能(AI)和机器学习在各个领域展示了具有变革性的能力。本研究概述了 2017 年至 2023 年间超过 40 篇论文中关于专利分析的最新人工智能工具,包括适用于专利图像和文本数据的方法。此外,我们提出了一种基于专利生命周期任务和人工智能方法特性的新分类法。该调查旨在为人工智能专利分析领域的研究人员、实践者和专利办公室提供资源。
Apr, 2024
本研究旨在评估基于不同 NLP 嵌入模型的专利数据嵌入模型计算专利技术相似度的准确度,提出了一个评估嵌入模型准确度的标准库和数据集,研究结果表明 PatentSBERTa、Bert-for-patent 和 TF-IDF 加权词嵌入在子类别级别计算句子嵌入具有最好的精确度。
Apr, 2022
本文旨在解决 AILA2021(法律协助人工智能)中的任务之一,在使用 BERT 获取的句子嵌入和线性分类器的结合下,将文档在语义上分割为 7 个预定义标签或 “修辞角色”,通过对实验加权分析,表明赋予最高频率类别更大的权重可获得更好的结果。在任务 1 中,团队 legalNLP 获得了 0.22 的 F1 分数。
Feb, 2022
使用 ALTA 2018 共享任务提供的已注释数据集,我们提供了自动分类专利申请的方法。通过多种方法的测试,利用 SVM 集成使用单词和字符组合作为特征,最佳结果在 14 支队伍中排名第一的 0.778 微平均 F1 - 值实现了将专利申请按照基于国际专利分类(IPC)的粗粒度分类法分为八个类别的目标。
Nov, 2018
本研究旨在为与绿色塑料相关的技术提供多层级多标签专利分类,并使用 SciBERT 神经网络模型提取语义信息,以便为这个新兴领域提供有效的分类方法。
Feb, 2023
在专利审查中,基于图像的检索系统对于识别当前专利图像与现有技术之间的相似性至关重要,以确保专利申请的新颖性和非显而易见性。我们提出了一种基于语言的、分布感知的多模态专利图像特征学习方法,通过集成大型语言模型,丰富专利图像的语义理解,并通过我们提出的分布感知对比损失来提高在代表性类别中的性能。在 DeepPatent2 数据集上进行的大量实验表明,我们提出的方法在基于图像的专利检索方面取得了最先进或可比较的性能,平均准确率提高了 53.3%,前 10 个检索结果的召回率提高了 41.8%,前 10 个检索结果的 MRR 提高了 51.9%。此外,通过深入用户分析,我们探索了我们的模型在帮助专利专业人员进行图像检索方面的作用,凸显了该模型的实际适用性和效果。
Apr, 2024
通过介绍层次相关传播方法,我们提出了一种新颖的深度可解释专利分类框架,用于提供人类可理解的预测解释。实验结果表明,对于各种评估指标,生成的解释突出了与预测类别相一致的重要相关词汇,使预测结果更易理解,并有助于推广复杂的 AI 专利分类方法在实际应用中的采用。
Oct, 2023