人工智能和美国专利商标局开放数据的最新发展
本文介绍了哈佛美国专利商标局专利数据集(HUPD),是规模大、结构良好且多用途的英文专利申请语料库,可用于创新、人工智能和自然语言处理领域的多项研究任务。
Jul, 2022
最近人工智能(AI)和机器学习在各个领域展示了具有变革性的能力。本研究概述了 2017 年至 2023 年间超过 40 篇论文中关于专利分析的最新人工智能工具,包括适用于专利图像和文本数据的方法。此外,我们提出了一种基于专利生命周期任务和人工智能方法特性的新分类法。该调查旨在为人工智能专利分析领域的研究人员、实践者和专利办公室提供资源。
Apr, 2024
专利及技术知识管理中的先进语言处理和机器学习技术承诺大规模效率改进。本文系统概述了与专利相关的任务和流行的方法,并着重介绍了发展中和有前景的技术。该研究表明,语言处理和特别是大型语言模型以及最近普遍应用的生成方法有望成为专利领域的颠覆者。然而,专利领域存在一些技术困难,现有模型难以解决。通过指出关键进展、机会和差距,我们旨在鼓励进一步研究,加速该领域的发展。
Mar, 2024
这项研究回顾了在过去两年中发表在 ACM 数字图书馆和 IEEE Xplore 会议记录中的研究论文,以自然语言处理 (NLP) 和文本挖掘 (TM) 的基本概念为支持,旨在了解公共部门中数据隐私、伦理、可解释性、可解释性、可信度和公平性等方面的见解,结果显示公平性是最常见的关注点,数据隐私是最不突出的主题,而可信度最突出,最后,也有可能获得关于 A.I. 在公共部门应用中的这些问题的有益见解。
Jul, 2023
介绍了科技政策资源获取的困难与问题,并探讨了相关技术和发展,提供了从大量混杂内容的数据中提取有价值的科技政策资源并提供准确、快速检索的方法,以打破信息壁垒和降低信息获取成本,具有重要的社会意义和社会效益。
Apr, 2022
本研究分析了 GitHub 平台上的开放数据格局及用户分享数据集的模式,并披露了 GitHub 是世界上最大的开放数据主机之一,研究还公开发布了三个数据集以支持分析。该平台的数据资源对于加速 AI 研究尤为重要。
Jun, 2023