使用 LLMs 和可解释模型的数据科学

AAAIFeb, 2024

使用 LLMs 和可解释模型的数据科学

Data Science with LLMs and Interpretable Models

Sebastian Bordt, Ben Lengerich, Harsha Nori, Rich Caruana

TL;DR大规模语言模型与可解释模型（Interpretable Models）能够相互配合，LLMs 能够描述、解释和调试广义可加模型（Generalized Additive Models），结合 GAMs 描述的统计模式，使得数据集概述、问题回答和模型评论成为可能。LLMs 还能改进领域专家和可解释模型之间的交互，并产生关于潜在现象的假设。

Abstract

Recent years have seen important advances in the building of interpretable models, machine learning models that are designed to be easily understood by humans. In this work, we show that large language models (LLMs) are remarkably good at working with →

interpretable models large language models generalized additive models dataset summarization model critique

发现论文，激发创造

LLMs 理解透明盒模型，发现意外，提出修复建议

通过采用分层推理方法，大型语言模型（LLMs）能够提供综合的模型级摘要，自动化数据科学中的常见任务，如检测与先前知识不符的异常情况，描述异常情况的潜在原因，并建议消除异常情况的修复方法。以医疗保健领域的多个例子为例，演示了 LLMs 的这些新功能的实用性，特别强调广义加性模型（GAMs）。最后，介绍了开源 LLM-GAM 界面工具包 TalkToEBM。

Aug, 2023

大语言模型时代的可解释性重新思考

可解释机器学习与大型语言模型相结合，评估解释方法并提出使用语言模型分析数据集和生成交互式解释的两个研究重点。

Jan, 2024

数据科学教育应如何处理大型语言模型？

大型语言模型 (Large Language Models, LLMs) 的迅猛发展正在革新数据科学和统计学，该论文旨在探讨 LLMs 对于数据科学教育的潜在机遇、资源和挑战，以及其在数据科学中的作用转变和创造性应用。

Jul, 2023

大型語言模型增強的機器學習分類器

利用预训练的大型语言模型 (LLM) 对经典的监督机器学习方法进行增强，以应对分类问题，并提出了几种将 LLM 集成到经典机器学习估计器中的方法，从而进一步提高预测性能。通过标准的有监督学习二分类任务和数据分布发生变化的迁移学习任务，对所提出的方法进行了性能评估。通过对四个公开的数据集进行数值实验，结果表明利用 LLM 增强经典机器学习估计器可以显著提升预测性能。

May, 2024

Emb-GAM：使用预训练语言模型的可解释和高效预测器

该研究利用神经语言模型提取输入的嵌入，学习嵌入空间中的线性模型来构建最终模型（称为 Emb-GAM），实现了透明的、线性的功能和特征交互，并能很好地泛化到新输入。通过各种自然语言处理数据集的实验，Emb-GAM 在不牺牲可解释性的情况下实现了强大的预测性能。

Sep, 2022

大型语言模型与游戏：调查与路线图

大语言模型（LLMs）在游戏中的应用和角色的综述和路线图，探讨了 LLMs 在游戏领域中未开发的领域和未来的发展方向。

Feb, 2024

关于在心理健康应用中重新思考大型语言模型

大型语言模型在心理健康方面表现出很大的潜力，但使用它们时需要保持谨慎和考虑，把它们视为辅助人类专业技术而非替代品，因为它们可能产生幻觉般的输出，并且在心理健康咨询中，人类辅导员的情感理解、细致解读和背景意识仍然不可替代。

Nov, 2023

时间序列数据与 LLM 相遇 - 可解释的金融时间序列预测

本文研究了利用大型语言模型在可解释金融时间序列预测中的应用，使用股票价格数据、公司元数据和历史新闻等多模态信号，在 NASDAQ-100 股票上进行实验，结果显示与一些基准模型相比，使用 GPT-4 和 Open LLaMA 这类新型模型进行零样本 / 少样本推断并通过基于指令的微调生成可解释预测，优于经典的 ARMA-GARCH 模型和梯度提升树模型。

Jun, 2023

大型语言模型是否成为数据流水线的新接口？

语言模型是一种广义的术语，它包含了各种类型的模型，旨在理解和生成人类的交流。大型语言模型（LLM）因其具有与人类类似的流畅和连贯性处理文本的能力而引起了人们的广泛关注，这使它们在以管道方式构建的各种数据相关任务中具有价值。LLM 在自然语言理解和生成方面的能力，结合其可伸缩性、多样性和领先性能，使其在诸如解释性人工智能（XAI）、自动化机器学习（AutoML）和知识图谱（KG）等各个人工智能领域具有创新应用的能力。此外，我们还相信这些模型能够从大规模数据中提取有价值的见解，并进行数据驱动的决策，这种做法通常被称为大数据分析（BDA）。在本立场论文中，我们对这些技术之间的协同作用提供一些讨论，该协同作用可以实现更强大和智能的人工智能解决方案，推动在整合人、计算机和知识的各种应用和领域中数据管道的改进。

Jun, 2024

MentalLLaMA: 基于大型语言模型的社交媒体可解释性心理健康分析

开发了第一个用于社交媒体上的可解释性心理健康分析的开源语言模型系列 MentalLLaMA，并通过 IMHI 数据集在正确性和解释质量方面接近最先进的判别方法。

Sep, 2023