基于 LLM 的专利矛盾提取
本文提出了一种新的间接推理(IR)方法,利用逆否命题和矛盾的逻辑来解决事实推理和数学证明等 IR 任务,以加强大型语言模型(LLMs)的推理能力。与传统 DR 方法相比,我们的 IR 方法通过对话模板触发 LLMs 进行基于矛盾推论的 IR 过程来提高推理准确性,并且与 IR 或 DR 单独使用相比,IR 和 DR 结合的方法表现出更高的效果。
Feb, 2024
介绍了一种新颖的数据生成方法用于矛盾检测,结合了大型语言模型的生成能力和语言规则,旨在提供一种取得深入语言分析和高效语言模型微调的原型矛盾语料库。
Oct, 2023
专利及技术知识管理中的先进语言处理和机器学习技术承诺大规模效率改进。本文系统概述了与专利相关的任务和流行的方法,并着重介绍了发展中和有前景的技术。该研究表明,语言处理和特别是大型语言模型以及最近普遍应用的生成方法有望成为专利领域的颠覆者。然而,专利领域存在一些技术困难,现有模型难以解决。通过指出关键进展、机会和差距,我们旨在鼓励进一步研究,加速该领域的发展。
Mar, 2024
AutoTRIZ 是一种利用大语言模型来自动和增强 TRIZ 方法的人工创意工具,通过广泛的知识和高级推理能力,提供了一种通过人工智能进行设计自动化和可解释创意的新方法。
Mar, 2024
该研究介绍了 ContraDoc,这是第一个用于研究长文档中自相矛盾的人工注释数据集,通过分析四种最先进的开源和商业化大型语言模型(GPT3.5、GPT4、PaLM2 和 LLaMAv2)在该数据集上的能力,发现 GPT4 表现最佳,但仍然在需要更多细微差别和上下文的自相矛盾方面不可靠。
Nov, 2023
本文分析了自相矛盾在大型语言模型中的表现,并提出了评估,检测和缓解的方法。研究发现,自相矛盾经常发生,但我们开发的框架可以准确地检测和减少自相矛盾。
May, 2023
本文通过构建一个数据集,研究了当前大型语言模型在专利声明生成方面的表现。结果表明,基于专利描述生成声明的性能优于先前仅基于摘要的研究。与最先进的通用大型语言模型相比,当前专利特定的大型语言模型表现较差,强调了在该领域开展未来研究的必要性。此外,我们还发现大型语言模型能够产生高质量的首要独立声明,但是对于后续的从属声明,性能显著下降。此外,微调可以增强发明特征的完整性、概念清晰度和特征关联。在测试的大型语言模型中,GPT-4 在专利专家的综合人工评价中表现最佳,具有更好的特征覆盖率、概念清晰度和技术连贯性。尽管具备这些能力,仍需要进行全面的修订和修改,以通过严格的专利审查并确保法律的稳健性。
Jun, 2024
使用生成式语言模型 (GPT-4) 新方法进行大规模文本分析。将这一方法应用于发现美国人工智能专利中的公共价值表达。使用我们设计的 GPT-4 提示和调查数据库中的所有专利文件,以确定和标记 AI 专利句中的公共价值表述。使用由 GPT-4 生成的标签来训练 BERT 模型的分类器,从而获得高的 F1 分数。这表明,使用有条理的框架设计和交互式人类监督,生成式语言模型可以在产生标签和理性方面具有显着优势,同时不会降低质量。
May, 2023
在专利审查中,基于图像的检索系统对于识别当前专利图像与现有技术之间的相似性至关重要,以确保专利申请的新颖性和非显而易见性。我们提出了一种基于语言的、分布感知的多模态专利图像特征学习方法,通过集成大型语言模型,丰富专利图像的语义理解,并通过我们提出的分布感知对比损失来提高在代表性类别中的性能。在 DeepPatent2 数据集上进行的大量实验表明,我们提出的方法在基于图像的专利检索方面取得了最先进或可比较的性能,平均准确率提高了 53.3%,前 10 个检索结果的召回率提高了 41.8%,前 10 个检索结果的 MRR 提高了 51.9%。此外,通过深入用户分析,我们探索了我们的模型在帮助专利专业人员进行图像检索方面的作用,凸显了该模型的实际适用性和效果。
Apr, 2024
SparseCL 是一种使用特殊训练的句子嵌入来有效地识别和检索与给定查询矛盾的文档的新方法。通过结合余弦相似度和稀疏函数的组合度量,此方法显着提高了矛盾检测的速度,并且在大规模文本语料库中表现出较高的准确性和效率。
Jun, 2024