Apr, 2024

大型语言模型可自动为少样本表格学习生成特征

TL;DR提出了一种新颖的上下文学习框架 FealtLLM,利用大型语言模型作为特征工程师,生成适合表格预测的优化输入数据集,在推断阶段使用生成的特征和简单的下游机器学习模型 (如线性回归) 来推断分类的可能性,从而实现高性能的小样本学习。FeatLLM 框架只使用简单的预测模型和推断时发现的特征,相较于现有的基于大型语言模型的方法,FeatLLM 可以消除每个样本都需要查询大型语言模型的需求和克服提示大小的限制,并且仅需要对大型语言模型的 API 进行访问。在多个来自不同领域的表格数据集上的实验证明,FeatLLM 生成高质量的规则,明显 (平均达到 10%) 优于 TabLLM 和 STUNT 等替代方法。