人工智能探索专利领域
最近人工智能(AI)和机器学习在各个领域展示了具有变革性的能力。本研究概述了 2017 年至 2023 年间超过 40 篇论文中关于专利分析的最新人工智能工具,包括适用于专利图像和文本数据的方法。此外,我们提出了一种基于专利生命周期任务和人工智能方法特性的新分类法。该调查旨在为人工智能专利分析领域的研究人员、实践者和专利办公室提供资源。
Apr, 2024
我们介绍了一种专门设计用于评估机器生成专利文本中两个不同任务的全面错误类型学,即声明到摘要的生成以及给定前面声明的生成下一个声明。我们还开发了一个用于系统评估语言模型在此背景下的基准测试工具 PatentEval。此外,我们还对各种模型进行了人工标注的比较分析,这些模型从专门为专利领域内的任务而进行训练的模型到最新的通用大型语言模型(LLMs)。此外,我们还探索和评估了一些指标来近似专利文本评估中的人工判断,并分析这些指标在专家评估中的一致性程度。这些方法对当前语言模型在专利文本生成领域的能力和局限性提供了有价值的见解。
Jun, 2024
本文通过构建一个数据集,研究了当前大型语言模型在专利声明生成方面的表现。结果表明,基于专利描述生成声明的性能优于先前仅基于摘要的研究。与最先进的通用大型语言模型相比,当前专利特定的大型语言模型表现较差,强调了在该领域开展未来研究的必要性。此外,我们还发现大型语言模型能够产生高质量的首要独立声明,但是对于后续的从属声明,性能显著下降。此外,微调可以增强发明特征的完整性、概念清晰度和特征关联。在测试的大型语言模型中,GPT-4 在专利专家的综合人工评价中表现最佳,具有更好的特征覆盖率、概念清晰度和技术连贯性。尽管具备这些能力,仍需要进行全面的修订和修改,以通过严格的专利审查并确保法律的稳健性。
Jun, 2024
通过人类反馈学习强化学习模型,以提高生成专利权要求的语言模型被授予的可能性,并证明生成语言模型能够反映专利申请中的人类反馈或意图。
May, 2024
本研究旨在构建专利领域的生成语言模型,并从人本主义的角度评估模型。通过计算根据生成模型预测可在自动完成上为用户省略的按键比例来评估模型性能。在此度量基础上,发现最大的模型不一定是最好的。在本研究中发布了多个基于专利语料库从头开始预训练的模型。此外,本文提出了专利法的几个法律含义,未来可能进行跨学科研究。特别地,基于模型预测的度量是否可用作专利法中的非明显性要求度量?
Jun, 2022
在专利审查中,基于图像的检索系统对于识别当前专利图像与现有技术之间的相似性至关重要,以确保专利申请的新颖性和非显而易见性。我们提出了一种基于语言的、分布感知的多模态专利图像特征学习方法,通过集成大型语言模型,丰富专利图像的语义理解,并通过我们提出的分布感知对比损失来提高在代表性类别中的性能。在 DeepPatent2 数据集上进行的大量实验表明,我们提出的方法在基于图像的专利检索方面取得了最先进或可比较的性能,平均准确率提高了 53.3%,前 10 个检索结果的召回率提高了 41.8%,前 10 个检索结果的 MRR 提高了 51.9%。此外,通过深入用户分析,我们探索了我们的模型在帮助专利专业人员进行图像检索方面的作用,凸显了该模型的实际适用性和效果。
Apr, 2024
专利是一种旨在保护发明的法律文件,同时也旨在在技术知识流通方面发挥作用。该论文提出了一种通过改写的方法来自动简化专利文本,并提出了一种用于专利句子的大规模银标准自动生成方法。人工评估表明生成的银标准语料库在语法、适应性和句子简单性方面被认为是合适的。
Oct, 2023
本论文使用领先的 ChatGPT 技术对专利进行分析,以更准确地预测其价值和影响力,为初创企业和小型公司的知识产权政策提供了改革的机遇。
Jun, 2023
应用大型语言模型在知识产权领域具有挑战性,本研究提出了一种低成本、标准化的过程来训练面向知识产权的语言模型,成功满足了该领域的需求,并证明了在知识产权领域中专门训练的模型的有效性。
Apr, 2024
提出了使用自然语言处理技术和深度学习方法对美国专利和商标局发布的与人工智能相关的专利进行分类的方法,采用变形的 BERT 和句子关注机制来克服 BERT 的局限性,实验结果表现最好。
Mar, 2023