Apr, 2024

大型语言模型在专利图像检索中的应用

TL;DR在专利审查中,基于图像的检索系统对于识别当前专利图像与现有技术之间的相似性至关重要,以确保专利申请的新颖性和非显而易见性。我们提出了一种基于语言的、分布感知的多模态专利图像特征学习方法,通过集成大型语言模型,丰富专利图像的语义理解,并通过我们提出的分布感知对比损失来提高在代表性类别中的性能。在DeepPatent2数据集上进行的大量实验表明,我们提出的方法在基于图像的专利检索方面取得了最先进或可比较的性能,平均准确率提高了53.3%,前10个检索结果的召回率提高了41.8%,前10个检索结果的MRR提高了51.9%。此外,通过深入用户分析,我们探索了我们的模型在帮助专利专业人员进行图像检索方面的作用,凸显了该模型的实际适用性和效果。