人工智能探索专利领域

Mar, 2024

Artificial Intelligence Exploring the Patent Field

Lekang Jiang, Stephan Goetz

TL;DR专利及技术知识管理中的先进语言处理和机器学习技术承诺大规模效率改进。本文系统概述了与专利相关的任务和流行的方法，并着重介绍了发展中和有前景的技术。该研究表明，语言处理和特别是大型语言模型以及最近普遍应用的生成方法有望成为专利领域的颠覆者。然而，专利领域存在一些技术困难，现有模型难以解决。通过指出关键进展、机会和差距，我们旨在鼓励进一步研究，加速该领域的发展。

Abstract

Advanced language-processing and machine-learning techniques promise massive efficiency improvements in the previously widely manual field of pat

language-processing machine-learning patent knowledge management language models

发现论文，激发创造

基于人工智能方法的专利综合调查

最近人工智能（AI）和机器学习在各个领域展示了具有变革性的能力。本研究概述了 2017 年至 2023 年间超过 40 篇论文中关于专利分析的最新人工智能工具，包括适用于专利图像和文本数据的方法。此外，我们提出了一种基于专利生命周期任务和人工智能方法特性的新分类法。该调查旨在为人工智能专利分析领域的研究人员、实践者和专利办公室提供资源。

Apr, 2024

专利评估：理解专利生成中的错误

我们介绍了一种专门设计用于评估机器生成专利文本中两个不同任务的全面错误类型学，即声明到摘要的生成以及给定前面声明的生成下一个声明。我们还开发了一个用于系统评估语言模型在此背景下的基准测试工具 PatentEval。此外，我们还对各种模型进行了人工标注的比较分析，这些模型从专门为专利领域内的任务而进行训练的模型到最新的通用大型语言模型（LLMs）。此外，我们还探索和评估了一些指标来近似专利文本评估中的人工判断，并分析这些指标在专家评估中的一致性程度。这些方法对当前语言模型在专利文本生成领域的能力和局限性提供了有价值的见解。

Jun, 2024

大型语言模型能否生成高质量的专利要求？

本文通过构建一个数据集，研究了当前大型语言模型在专利声明生成方面的表现。结果表明，基于专利描述生成声明的性能优于先前仅基于摘要的研究。与最先进的通用大型语言模型相比，当前专利特定的大型语言模型表现较差，强调了在该领域开展未来研究的必要性。此外，我们还发现大型语言模型能够产生高质量的首要独立声明，但是对于后续的从属声明，性能显著下降。此外，微调可以增强发明特征的完整性、概念清晰度和特征关联。在测试的大型语言模型中，GPT-4 在专利专家的综合人工评价中表现最佳，具有更好的特征覆盖率、概念清晰度和技术连贯性。尽管具备这些能力，仍需要进行全面的修订和修改，以通过严格的专利审查并确保法律的稳健性。

Jun, 2024

InstructPatentGPT: 使用人类反馈训练专利语言模型遵循指示

通过人类反馈学习强化学习模型，以提高生成专利权要求的语言模型被授予的可能性，并证明生成语言模型能够反映专利申请中的人类反馈或意图。

May, 2024

评估生成式专利语言模型

本研究旨在构建专利领域的生成语言模型，并从人本主义的角度评估模型。通过计算根据生成模型预测可在自动完成上为用户省略的按键比例来评估模型性能。在此度量基础上，发现最大的模型不一定是最好的。在本研究中发布了多个基于专利语料库从头开始预训练的模型。此外，本文提出了专利法的几个法律含义，未来可能进行跨学科研究。特别地，基于模型预测的度量是否可用作专利法中的非明显性要求度量？

Jun, 2022

大型语言模型在专利图像检索中的应用

在专利审查中，基于图像的检索系统对于识别当前专利图像与现有技术之间的相似性至关重要，以确保专利申请的新颖性和非显而易见性。我们提出了一种基于语言的、分布感知的多模态专利图像特征学习方法，通过集成大型语言模型，丰富专利图像的语义理解，并通过我们提出的分布感知对比损失来提高在代表性类别中的性能。在 DeepPatent2 数据集上进行的大量实验表明，我们提出的方法在基于图像的专利检索方面取得了最先进或可比较的性能，平均准确率提高了 53.3％，前 10 个检索结果的召回率提高了 41.8％，前 10 个检索结果的 MRR 提高了 51.9％。此外，通过深入用户分析，我们探索了我们的模型在帮助专利专业人员进行图像检索方面的作用，凸显了该模型的实际适用性和效果。

Apr, 2024

创造专利简化的银标准

专利是一种旨在保护发明的法律文件，同时也旨在在技术知识流通方面发挥作用。该论文提出了一种通过改写的方法来自动简化专利文本，并提出了一种用于专利句子的大规模银标准自动生成方法。人工评估表明生成的银标准语料库在语法、适应性和句子简单性方面被认为是合适的。

Oct, 2023

预测性专利基因组学：利用 ChatGPT 预测创新成功和估值

本论文使用领先的 ChatGPT 技术对专利进行分析，以更准确地预测其价值和影响力，为初创企业和小型公司的知识产权政策提供了改革的机遇。

Jun, 2023

PatentGPT：一个大规模的知识产权语言模型

应用大型语言模型在知识产权领域具有挑战性，本研究提出了一种低成本、标准化的过程来训练面向知识产权的语言模型，成功满足了该领域的需求，并证明了在知识产权领域中专门训练的模型的有效性。

Apr, 2024

使用 Modified D2SBERT 和 Sentence Attention 机制进行人工智能相关专利的多标签分类

提出了使用自然语言处理技术和深度学习方法对美国专利和商标局发布的与人工智能相关的专利进行分类的方法，采用变形的 BERT 和句子关注机制来克服 BERT 的局限性，实验结果表现最好。

Mar, 2023