Jun, 2024

SyntheT2C: 为在 Text2Cypher 任务中微调大型语言模型生成合成数据

TL;DR综合大型语言模型(LLMs)与现有知识图谱(KG)数据库为一体,旨在增强 LLM 的效力和减轻其 “幻觉”。本研究提出 SyntheT2C 方法,通过基于 LLM 的提示和模板填充的两个不同流程,构建了一个合成的查询 - Cypher 对数据集,以样本值采样自底层 Neo4j 图数据库。实验证明,MedT2C 数据集有效提升了主干 LLM 在 Text2Cypher 任务上的性能。