大型语言模型调查
对大型语言模型(LLMs)进行了综述,包括三个流行的 LLM 系列(GPT,LLaMA,PaLM)的特点、贡献和局限性,同时讨论了构建和增强 LLMs 的技术、为 LLM 训练、微调和评估准备的常用数据集以及常用的 LLM 评估指标,最后讨论了未来的挑战和研究方向。
Feb, 2024
通过对多个 LLM 模型的研究,本文不仅提供了全面的概述,还明确了现有挑战,并指出了未来的研究方向。该综述提供了关于生成型人工智能的当前状态的全面观点,为进一步的探索、增强和创新提供了启示。
Mar, 2024
这篇研究论文总结了大型语言模型(LLMs)不同子类的最新发展,包括基于任务的金融 LLMs、多语言 LLMs、生物医学和临床 LLMs,以及视觉语言 LLMs 和代码语言模型。它还强调了聊天机器人和虚拟助手开发领域中的未解决问题,如增强自然语言处理、提升聊天机器人智能性以及解决道德和法律困境,旨在为对基于 LLMs 的聊天机器人和虚拟智能助手技术感兴趣的读者、开发者、学者和用户提供有用的信息和未来方向。
Jul, 2023
该论文调查了大型语言模型的八个潜在问题,包括其预测能力的增强,不可预测的行为的出现,对外部世界的学习和使用表示,行为引导技术的不可靠性,内部工作方式的解释困难性,性能上界不是人类任务表现,不一定表达其创建者或网络文本编码的价值观,与 LLMs 的简短交往经常是误导性的。
Apr, 2023
语言模型是一种广义的术语,它包含了各种类型的模型,旨在理解和生成人类的交流。大型语言模型(LLM)因其具有与人类类似的流畅和连贯性处理文本的能力而引起了人们的广泛关注,这使它们在以管道方式构建的各种数据相关任务中具有价值。LLM 在自然语言理解和生成方面的能力,结合其可伸缩性、多样性和领先性能,使其在诸如解释性人工智能(XAI)、自动化机器学习(AutoML)和知识图谱(KG)等各个人工智能领域具有创新应用的能力。此外,我们还相信这些模型能够从大规模数据中提取有价值的见解,并进行数据驱动的决策,这种做法通常被称为大数据分析(BDA)。在本立场论文中,我们对这些技术之间的协同作用提供一些讨论,该协同作用可以实现更强大和智能的人工智能解决方案,推动在整合人、计算机和知识的各种应用和领域中数据管道的改进。
Jun, 2024
本篇综述论文全面分析了大型语言模型的架构及其分类、训练策略、训练数据集和性能评估,并讨论了未来的研究方向,最后总结了大型语言模型研究的重要发现和关键的架构和训练策略。
Jul, 2023
大语言模型 (LLMs) 在教育领域带来了新的可能性。本综述论文从多个角度总结了 LLMs 在教育环境中的各种技术,包括学生和教师辅助、自适应学习和商业工具。我们系统地审查了每个角度的技术进展,整理了相关的数据集和基准,并识别了在教育中部署 LLMs 所面临的风险和挑战。此外,我们概述了未来的研究机会,强调潜在的有前途的方向。我们的综述旨在为教育工作者、研究人员和决策者提供一个全面的技术画面,以利用 LLMs 的力量革新教育实践,并促进更有效的个性化学习环境。
Mar, 2024