大型语言模型与向量数据库相遇：一份调查

Jan, 2024

大型语言模型与向量数据库相遇：一份调查

When Large Language Models Meet Vector Databases: A Survey

Zhi Jing, Yongye Su, Yikun Han, Bo Yuan, Chunjiang Liu...

TL;DR大语言模型与向量数据库之间的交叉点进行了深入和独特的分析。

Abstract

The recent burst in large language models has opened new frontiers in human-like text processing and generation. However, alongside their remarkable growth, large language models have encountered critical challen

large language models vector databases hallucination bias real-time knowledge updates

发现论文，激发创造

利用文本嵌入模型和向量数据库作为文本分类器的例子 —— 以医疗数据为例

利用大语言模型、向量嵌入模型和向量数据库来分类医生的病例笔记，以了解这些方法的局限性和未来潜在应用的前景。

Feb, 2024

知识融合与大型语言模型的趋势：方法、基准和应用的调查和分类

通过综述知识融入大型语言模型的趋势、方法分类、基准和应用，本文概述了该研究领域的全貌，并指出了未来的研究方向。

Nov, 2023

ChatSOS：增强安全工程的矢量数据库生成问答助手

通过开发一个向量数据库，该研究证明外部数据库对大型语言模型具有补充作用，提高了可靠性、准确性和全面性，并改善了回答的适应性和解释能力，展示了大型语言模型在安全工程中处理专业问题的潜力，为更广泛的应用奠定了基础。

May, 2024

大型语言模型在表格数据上的应用 -- 综述

综述中介绍了大规模语言建模在表格数据建模相关任务中的应用，包括预测、表格数据合成、问答和表格理解。通过归纳最新进展和总结数据集、度量标准和方法论，本综述发现了现有领域文献的优势、局限性、未开发的领域和研究间隙，并提供了相关代码和数据集的参考。期望以此为读者提供有关参考和深入见解，为他们在这个重要且快速进展的领域中有效应对挑战提供必备的工具和知识。

Feb, 2024

若语源能言：评估大型语言模型在历史研究辅助中的应用

通过给强大的大型语言模型（LLM）增加来自高度专业化学术源的向量嵌入，我们展示了一种基于对话的方法可以使历史学家和其他人文学科的研究人员能够使用 LLMs 来检查不同类型文档的自定义语料库，并评估了 LLMs 在问题回答和数据提取组织两大任务上的表现。

Oct, 2023

下一代数据库接口：LLM 基于文本到 SQL 的调查

根据自然语言问题（文本到 SQL）生成准确的 SQL 是一个长期存在的问题，传统的文本到 SQL 系统使用人工工程和深度神经网络，而最近的大型语言模型（LLMs）已经展示出在自然语言理解方面的显著能力，因此，将 LLM-based 实现整合到文本到 SQL 研究中可以带来独特的机遇、挑战和解决方案。

Jun, 2024

LLM 增强数据管理

LLMDB 是一种通过应用机器学习和大型语言模型优化数据管理问题的范例，具有高泛化能力和推理能力，可避免幻觉问题，并通过引入特定领域的知识、矢量数据库和 LLM 代理来提高准确性，其中三个真实场景包括查询重写、数据库诊断和数据分析。

Feb, 2024

使用 SQL 查询大型语言模型

使用大语言模型和 SQL 查询从自然语言文本中提取数据和查询，是信息检索和处理的新方向并带来了新的挑战和机遇。

Apr, 2023

增强语言模型数据整合的学习

本篇论文研究了大型语言模型的局限性，提出了使用外部数据访问技术扩展语言模型的解决方法，并将其与数据集成的研究进行了比较，探讨了研究路径的启示。

Apr, 2023

大型语言模型是否成为数据流水线的新接口？

语言模型是一种广义的术语，它包含了各种类型的模型，旨在理解和生成人类的交流。大型语言模型（LLM）因其具有与人类类似的流畅和连贯性处理文本的能力而引起了人们的广泛关注，这使它们在以管道方式构建的各种数据相关任务中具有价值。LLM 在自然语言理解和生成方面的能力，结合其可伸缩性、多样性和领先性能，使其在诸如解释性人工智能（XAI）、自动化机器学习（AutoML）和知识图谱（KG）等各个人工智能领域具有创新应用的能力。此外，我们还相信这些模型能够从大规模数据中提取有价值的见解，并进行数据驱动的决策，这种做法通常被称为大数据分析（BDA）。在本立场论文中，我们对这些技术之间的协同作用提供一些讨论，该协同作用可以实现更强大和智能的人工智能解决方案，推动在整合人、计算机和知识的各种应用和领域中数据管道的改进。

Jun, 2024