Nov, 2022

专利文本中用于上下位词检索的技术分类

TL;DR本文提出了一种基于专利合作分类(CPC)的技术术语分类自动化方法,生成的分类包含 9 个独立技术分支中的约 170k 个节点,并且使用 Text-to-Text Transfer Transformer (T5) 模型 fine-tune 生成上下位词并得到相对较高的准确性,从而证明了此资源的质量。T5 模型可以打开新的技术术语的分类(根据上下位关系),因此这个资源可以更新,是技术术语领域不断发展的必要特性。