Dec, 2023

具有用户定义提示的 LLMs 作为可靠数据处理的通用数据操作器

TL;DR为了解决用户定义函数的设计模式在机器学习流水线中所面临的挑战,我们提出了一种新的设计模式,利用大型语言模型作为通用数据操作符 (LLM-GDO) 来进行可靠的数据清理、转换和建模,在 LLM-GDO 设计模式中,使用用户定义的提示来表示数据处理逻辑,而不是使用特定编程语言的实现。利用领域特定数据对 LLMs 进行微调可以增强领域特定任务的性能,使数据处理具备知识感知的能力。我们通过不同的数据处理任务的例子来说明这些优点,并总结了 LLMs 引入的挑战和机会,以提供对该设计模式的全面理解,以供更多的讨论。