Apr, 2022

专利分析中句子嵌入模型表现的调查

TL;DR本研究旨在评估基于不同 NLP 嵌入模型的专利数据嵌入模型计算专利技术相似度的准确度,提出了一个评估嵌入模型准确度的标准库和数据集,研究结果表明 PatentSBERTa、Bert-for-patent 和 TF-IDF 加权词嵌入在子类别级别计算句子嵌入具有最好的精确度。