大型语言模型与向量数据库相遇:一份调查
通过开发一个向量数据库,该研究证明外部数据库对大型语言模型具有补充作用,提高了可靠性、准确性和全面性,并改善了回答的适应性和解释能力,展示了大型语言模型在安全工程中处理专业问题的潜力,为更广泛的应用奠定了基础。
May, 2024
综述中介绍了大规模语言建模在表格数据建模相关任务中的应用,包括预测、表格数据合成、问答和表格理解。通过归纳最新进展和总结数据集、度量标准和方法论,本综述发现了现有领域文献的优势、局限性、未开发的领域和研究间隙,并提供了相关代码和数据集的参考。期望以此为读者提供有关参考和深入见解,为他们在这个重要且快速进展的领域中有效应对挑战提供必备的工具和知识。
Feb, 2024
通过给强大的大型语言模型(LLM)增加来自高度专业化学术源的向量嵌入,我们展示了一种基于对话的方法可以使历史学家和其他人文学科的研究人员能够使用 LLMs 来检查不同类型文档的自定义语料库,并评估了 LLMs 在问题回答和数据提取组织两大任务上的表现。
Oct, 2023
根据自然语言问题(文本到 SQL)生成准确的 SQL 是一个长期存在的问题,传统的文本到 SQL 系统使用人工工程和深度神经网络,而最近的大型语言模型(LLMs)已经展示出在自然语言理解方面的显著能力,因此,将 LLM-based 实现整合到文本到 SQL 研究中可以带来独特的机遇、挑战和解决方案。
Jun, 2024
LLMDB 是一种通过应用机器学习和大型语言模型优化数据管理问题的范例,具有高泛化能力和推理能力,可避免幻觉问题,并通过引入特定领域的知识、矢量数据库和 LLM 代理来提高准确性,其中三个真实场景包括查询重写、数据库诊断和数据分析。
Feb, 2024
语言模型是一种广义的术语,它包含了各种类型的模型,旨在理解和生成人类的交流。大型语言模型(LLM)因其具有与人类类似的流畅和连贯性处理文本的能力而引起了人们的广泛关注,这使它们在以管道方式构建的各种数据相关任务中具有价值。LLM 在自然语言理解和生成方面的能力,结合其可伸缩性、多样性和领先性能,使其在诸如解释性人工智能(XAI)、自动化机器学习(AutoML)和知识图谱(KG)等各个人工智能领域具有创新应用的能力。此外,我们还相信这些模型能够从大规模数据中提取有价值的见解,并进行数据驱动的决策,这种做法通常被称为大数据分析(BDA)。在本立场论文中,我们对这些技术之间的协同作用提供一些讨论,该协同作用可以实现更强大和智能的人工智能解决方案,推动在整合人、计算机和知识的各种应用和领域中数据管道的改进。
Jun, 2024