基于 LLM 的专利矛盾提取

Mar, 2024

LLM-based Extraction of Contradictions from Patents

Stefan Trapp, Joachim Warschat

TL;DR本文提出了一种基于 Prompt Engineering 的方法，利用生成式大型语言模型（LLM），即 OpenAI 的 GPT-4，从专利文本中提取 TRIZ 矛盾。

Abstract

Already since the 1950s triz shows that patents and the technical contradictions they solve are an important source of inspiration for the development of innovative products. However, triz is a heuristic based on

triz patent retrieval patent analysis inventive concepts contradiction detection

发现论文，激发创造

作为间接推理器的大型语言模型：自动推理的逆否和矛盾

本文提出了一种新的间接推理（IR）方法，利用逆否命题和矛盾的逻辑来解决事实推理和数学证明等 IR 任务，以加强大型语言模型（LLMs）的推理能力。与传统 DR 方法相比，我们的 IR 方法通过对话模板触发 LLMs 进行基于矛盾推论的 IR 过程来提高推理准确性，并且与 IR 或 DR 单独使用相比，IR 和 DR 结合的方法表现出更高的效果。

Feb, 2024

利用大型语言模型和语言规则生成矛盾检测的原型

介绍了一种新颖的数据生成方法用于矛盾检测，结合了大型语言模型的生成能力和语言规则，旨在提供一种取得深入语言分析和高效语言模型微调的原型矛盾语料库。

Oct, 2023

人工智能探索专利领域

专利及技术知识管理中的先进语言处理和机器学习技术承诺大规模效率改进。本文系统概述了与专利相关的任务和流行的方法，并着重介绍了发展中和有前景的技术。该研究表明，语言处理和特别是大型语言模型以及最近普遍应用的生成方法有望成为专利领域的颠覆者。然而，专利领域存在一些技术困难，现有模型难以解决。通过指出关键进展、机会和差距，我们旨在鼓励进一步研究，加速该领域的发展。

Mar, 2024

AutoTRIZ：TRIZ 和大型语言模型的人工创意

AutoTRIZ 是一种利用大语言模型来自动和增强 TRIZ 方法的人工创意工具，通过广泛的知识和高级推理能力，提供了一种通过人工智能进行设计自动化和可解释创意的新方法。

Mar, 2024

ContraDoc：对大型语言模型中文档中的自相矛盾进行理解

该研究介绍了 ContraDoc，这是第一个用于研究长文档中自相矛盾的人工注释数据集，通过分析四种最先进的开源和商业化大型语言模型（GPT3.5、GPT4、PaLM2 和 LLaMAv2）在该数据集上的能力，发现 GPT4 表现最佳，但仍然在需要更多细微差别和上下文的自相矛盾方面不可靠。

Nov, 2023

大型语言模型的自相矛盾幻觉：评估、检测和缓解

本文分析了自相矛盾在大型语言模型中的表现，并提出了评估，检测和缓解的方法。研究发现，自相矛盾经常发生，但我们开发的框架可以准确地检测和减少自相矛盾。

May, 2023

大型语言模型能否生成高质量的专利要求？

本文通过构建一个数据集，研究了当前大型语言模型在专利声明生成方面的表现。结果表明，基于专利描述生成声明的性能优于先前仅基于摘要的研究。与最先进的通用大型语言模型相比，当前专利特定的大型语言模型表现较差，强调了在该领域开展未来研究的必要性。此外，我们还发现大型语言模型能够产生高质量的首要独立声明，但是对于后续的从属声明，性能显著下降。此外，微调可以增强发明特征的完整性、概念清晰度和特征关联。在测试的大型语言模型中，GPT-4 在专利专家的综合人工评价中表现最佳，具有更好的特征覆盖率、概念清晰度和技术连贯性。尽管具备这些能力，仍需要进行全面的修订和修改，以通过严格的专利审查并确保法律的稳健性。

Jun, 2024

使用生成式语言模型进行大规模文本分析：以 AI 专利中公共价值表达为例的案例研究

使用生成式语言模型 (GPT-4) 新方法进行大规模文本分析。将这一方法应用于发现美国人工智能专利中的公共价值表达。使用我们设计的 GPT-4 提示和调查数据库中的所有专利文件，以确定和标记 AI 专利句中的公共价值表述。使用由 GPT-4 生成的标签来训练 BERT 模型的分类器，从而获得高的 F1 分数。这表明，使用有条理的框架设计和交互式人类监督，生成式语言模型可以在产生标签和理性方面具有显着优势，同时不会降低质量。

May, 2023

大型语言模型在专利图像检索中的应用

在专利审查中，基于图像的检索系统对于识别当前专利图像与现有技术之间的相似性至关重要，以确保专利申请的新颖性和非显而易见性。我们提出了一种基于语言的、分布感知的多模态专利图像特征学习方法，通过集成大型语言模型，丰富专利图像的语义理解，并通过我们提出的分布感知对比损失来提高在代表性类别中的性能。在 DeepPatent2 数据集上进行的大量实验表明，我们提出的方法在基于图像的专利检索方面取得了最先进或可比较的性能，平均准确率提高了 53.3％，前 10 个检索结果的召回率提高了 41.8％，前 10 个检索结果的 MRR 提高了 51.9％。此外，通过深入用户分析，我们探索了我们的模型在帮助专利专业人员进行图像检索方面的作用，凸显了该模型的实际适用性和效果。

Apr, 2024

SparseCL：稀疏对比学习用于矛盾检索

SparseCL 是一种使用特殊训练的句子嵌入来有效地识别和检索与给定查询矛盾的文档的新方法。通过结合余弦相似度和稀疏函数的组合度量，此方法显着提高了矛盾检测的速度，并且在大规模文本语料库中表现出较高的准确性和效率。

Jun, 2024