大型语言模型作为文本挖掘的统一方法学

Dec, 2022

大型语言模型作为文本挖掘的统一方法学

Very Large Language Model as a Unified Methodology of Text Mining

Meng Jiang

TL;DR本文提出了一个新的文本挖掘方法：使用非常大的语言模型 (VLLM)，该方法具有文本摘要、信息提取、文本聚类等功能，取代了传统的文本挖掘方法并面临着新的挑战。

Abstract

text data mining is the process of deriving essential information from language text. Typical text mining tasks include text categorization, text clustering, topic modeling, information extraction, and

text data mining large language model text summarization information extraction text clustering

发现论文，激发创造

大型语言模型（LLM）的几个类别：简要调查

这篇研究论文总结了大型语言模型（LLMs）不同子类的最新发展，包括基于任务的金融 LLMs、多语言 LLMs、生物医学和临床 LLMs，以及视觉语言 LLMs 和代码语言模型。它还强调了聊天机器人和虚拟助手开发领域中的未解决问题，如增强自然语言处理、提升聊天机器人智能性以及解决道德和法律困境，旨在为对基于 LLMs 的聊天机器人和虚拟智能助手技术感兴趣的读者、开发者、学者和用户提供有用的信息和未来方向。

Jul, 2023

大型语言模型为传统主题建模方法提供了一种替代方案

本研究旨在探讨大型语言模型（LLMs）在主题提取方面的潜力，并建立评估协议以评估 LLMs 的聚类效果。通过深入实验与评估，总结了采用 LLMs 进行主题提取的优势和限制。

Mar, 2024

TnT-LLM：大规模文本挖掘与大型语言模型

利用大规模语言模型 (LLMs)，我们提出了 TnT-LLM 两阶段框架，自动化生成和分配标签，以最小人工工作量构建具有轻量级监督分类器的训练样本，并在 Bing Copilot 上应用此框架来分析用户意图和对话领域，实验结果表明 TnT-LLM 生成了更准确和相关的标签分类法，实现了在大规模分类中准确性和效率之间的有利平衡。

Mar, 2024

大型语言模型是否成为数据流水线的新接口？

语言模型是一种广义的术语，它包含了各种类型的模型，旨在理解和生成人类的交流。大型语言模型（LLM）因其具有与人类类似的流畅和连贯性处理文本的能力而引起了人们的广泛关注，这使它们在以管道方式构建的各种数据相关任务中具有价值。LLM 在自然语言理解和生成方面的能力，结合其可伸缩性、多样性和领先性能，使其在诸如解释性人工智能（XAI）、自动化机器学习（AutoML）和知识图谱（KG）等各个人工智能领域具有创新应用的能力。此外，我们还相信这些模型能够从大规模数据中提取有价值的见解，并进行数据驱动的决策，这种做法通常被称为大数据分析（BDA）。在本立场论文中，我们对这些技术之间的协同作用提供一些讨论，该协同作用可以实现更强大和智能的人工智能解决方案，推动在整合人、计算机和知识的各种应用和领域中数据管道的改进。

Jun, 2024

大型语言模型下的短文本主题建模

通过使用大型语言模型 (LLMs) 进行主题建模的两种方法，即并行提示和顺序提示，本文克服了传统主题模型在短文本上推断潜在主题时面临的挑战，并证明这些方法能够识别出比现有方法更连贯的主题，同时保持引发主题的多样性。此外，本研究发现所推断的主题充分涵盖了输入文本，而几乎没有产生虚构的主题。

Jun, 2024

大型语言模型用于时间序列的研究概述

该综述论文详细探讨了利用大型语言模型进行时间序列分析的各种方法，包括直接提示、时间序列量化、对齐技术、利用视觉作为桥梁机制以及与其他工具的结合，同时提供了现有的多模态时间序列和文本数据集的综合概述，并分析了该新兴领域的挑战和未来机会。

Feb, 2024

大型语言模型作为数据预处理器

此研究拓展了大型语言模型（LLMs）的应用，探索了它们在数据预处理中的潜力，包括错误检测、数据插补、模式匹配和实体匹配任务。我们提出了一个基于 LLMs 的框架，用于改进模型的性能和效率。实验结果表明 LLMs 在数据预处理中具有巨大潜力。

Aug, 2023

多模式大型语言模型综述

本文旨在追踪和总结 MLLM 的最新进展，包括 MLLM 的公式，技术和应用，以及现有的挑战和有前途的研究方向。

Jun, 2023

如何使用 LLMs 进行文本分析

该文介绍了大型语言模型（LLM）作为社会科学中一种高度多功能的文本分析方法，以及它们对文本注释、分类、情感分析和批判性话语分析等广泛的文本分析任务的应用。通过使用 Python，该文提供了针对具有有限编程经验的学生和研究人员的简单介绍，指导他们如何在自己的研究项目中使用 LLMs 进行文本分析，并提供了最佳实践建议。以政治文本中的民粹主义识别为例子，展示了 LLMs 如何超越现有的最新技术。

Jul, 2023

大型语言模型可完成商业流程管理任务

大规模语言模型（LLMs）在文本相关的业务流程管理任务中表现出与现有解决方案相当甚至更好的性能，这为未来的 BPM 研究和实际应用带来了重要的启示。

Jul, 2023