Nov, 2023

将 LLM 先验融入表格学习器

TL;DR我们介绍了一种方法,将大型语言模型(LLMs)与传统表格数据分类技术相结合,解决 LLMs 在数据序列化敏感性和偏差方面的挑战。我们引入了两种策略,利用 LLMs 对分类变量进行排序和生成连续变量与目标之间相关性的先验,提高了在少样本情况下的性能;我们专注于逻辑回归,引入了 MonotonicLR,它使用非线性单调函数将序数映射为基数,同时保留 LLM 确定的顺序。与基准模型的验证表明,我们的方法在低数据情景下表现出卓越的性能,同时保持可解释性。