Dec, 2023

水母:一个用于数据预处理的大型语言模型

TL;DR在本文中,我们介绍了 Jellyfish,一种基于开源 LLM 的通用数据隐私求解器,它能够在解决各种数据隐私任务时展现出通用性,并且具备理解自然语言的能力。Jellyfish 不仅能够在本地、单个低成本 GPU 上运行,并确保数据安全和进一步调试。我们构建 Jellyfish 所采用的技术包括预调优和数据隐私调优技术,同时拥有解释器,对其输出结果进行解释,并通过知识注入来提高数据隐私的性能。我们使用各种真实数据集对 Jellyfish 进行评估,结果显示它与最先进的方法相比具有竞争力且具有很强的泛化能力。Jellyfish 的性能与 GPT 系列模型相当,并且其解释器相较于 GPT-3.5 具有增强的推理能力。同时,我们的评估结果也突显了构建 Jellyfish 所采用的技术的有效性。