Feb, 2024

SPARQL 生成:对于在生命科学知识图谱上进行问答的 OpenLLaMA 微调分析

TL;DR利用大型语言模型 (LLM),本研究评估了几种策略用于在生命科学知识图谱上进行问题回答,并提出一种端到端的数据增强方法,使得即使在缺乏问题到 SPARQL 查询对的数据集的情况下,也能进行微调。此外,研究还探讨了查询中语义线索的作用,并在真实的基因表达知识图谱上进行了评估,结果表明语义线索可以提高模型性能,相比于随机变量名和没有注释的基准结果,性能提升最多达到 33%。