Feb, 2024
SPARQL 生成:对于在生命科学知识图谱上进行问答的 OpenLLaMA 微调分析
SPARQL Generation: an analysis on fine-tuning OpenLLaMA for Question Answering over a Life Science Knowledge Graph
Julio C. Rangel, Tarcisio Mendes de Farias, Ana Claudia Sima, Norio Kobayashi
TL;DR利用大型语言模型 (LLM),本研究评估了几种策略用于在生命科学知识图谱上进行问题回答,并提出一种端到端的数据增强方法,使得即使在缺乏问题到 SPARQL 查询对的数据集的情况下,也能进行微调。此外,研究还探讨了查询中语义线索的作用,并在真实的基因表达知识图谱上进行了评估,结果表明语义线索可以提高模型性能,相比于随机变量名和没有注释的基准结果,性能提升最多达到 33%。