预测性专利基因组学:利用 ChatGPT 预测创新成功和估值
专利及技术知识管理中的先进语言处理和机器学习技术承诺大规模效率改进。本文系统概述了与专利相关的任务和流行的方法,并着重介绍了发展中和有前景的技术。该研究表明,语言处理和特别是大型语言模型以及最近普遍应用的生成方法有望成为专利领域的颠覆者。然而,专利领域存在一些技术困难,现有模型难以解决。通过指出关键进展、机会和差距,我们旨在鼓励进一步研究,加速该领域的发展。
Mar, 2024
应用大型语言模型在知识产权领域具有挑战性,本研究提出了一种低成本、标准化的过程来训练面向知识产权的语言模型,成功满足了该领域的需求,并证明了在知识产权领域中专门训练的模型的有效性。
Apr, 2024
本文研究使用 ChatGPT 等大型语言模型进行情感分析,以预测股票市场回报的潜力,发现 ChatGPT 对股票市场预测的准确率高于传统情感分析方法,建议将高级语言模型纳入投资决策过程中,以提高量化交易策略的性能。
Apr, 2023
本研究旨在构建专利领域的生成语言模型,并从人本主义的角度评估模型。通过计算根据生成模型预测可在自动完成上为用户省略的按键比例来评估模型性能。在此度量基础上,发现最大的模型不一定是最好的。在本研究中发布了多个基于专利语料库从头开始预训练的模型。此外,本文提出了专利法的几个法律含义,未来可能进行跨学科研究。特别地,基于模型预测的度量是否可用作专利法中的非明显性要求度量?
Jun, 2022
最近人工智能(AI)和机器学习在各个领域展示了具有变革性的能力。本研究概述了 2017 年至 2023 年间超过 40 篇论文中关于专利分析的最新人工智能工具,包括适用于专利图像和文本数据的方法。此外,我们提出了一种基于专利生命周期任务和人工智能方法特性的新分类法。该调查旨在为人工智能专利分析领域的研究人员、实践者和专利办公室提供资源。
Apr, 2024
使用生成式语言模型 (GPT-4) 新方法进行大规模文本分析。将这一方法应用于发现美国人工智能专利中的公共价值表达。使用我们设计的 GPT-4 提示和调查数据库中的所有专利文件,以确定和标记 AI 专利句中的公共价值表述。使用由 GPT-4 生成的标签来训练 BERT 模型的分类器,从而获得高的 F1 分数。这表明,使用有条理的框架设计和交互式人类监督,生成式语言模型可以在产生标签和理性方面具有显着优势,同时不会降低质量。
May, 2023
通过人类反馈学习强化学习模型,以提高生成专利权要求的语言模型被授予的可能性,并证明生成语言模型能够反映专利申请中的人类反馈或意图。
May, 2024
本文研究了使用 OpenAI GPT-2 预训练模型进行专利权描述生成的微调方法,并探索了专利权描述语言的独特结构和样式。通过提出一种新的采样方法,我们对生成的专利权描述进行了分析和总结,并提供了未来研究的各种实验结果。
Jul, 2019
本文通过构建一个数据集,研究了当前大型语言模型在专利声明生成方面的表现。结果表明,基于专利描述生成声明的性能优于先前仅基于摘要的研究。与最先进的通用大型语言模型相比,当前专利特定的大型语言模型表现较差,强调了在该领域开展未来研究的必要性。此外,我们还发现大型语言模型能够产生高质量的首要独立声明,但是对于后续的从属声明,性能显著下降。此外,微调可以增强发明特征的完整性、概念清晰度和特征关联。在测试的大型语言模型中,GPT-4 在专利专家的综合人工评价中表现最佳,具有更好的特征覆盖率、概念清晰度和技术连贯性。尽管具备这些能力,仍需要进行全面的修订和修改,以通过严格的专利审查并确保法律的稳健性。
Jun, 2024