DeepThought:自主自律系统的架构
利用符号人工智能的代理设计历史,我们提出了一种新的认知语言代理的蓝图,即 Cognitive Architectures for Language Agents (CoALA) 框架,这个框架将大型语言模型与外部资源或内部控制流结合起来,以实现基于语言模型的推理、概念化、学习和决策。通过 CoALA 框架,我们强调了目前语言代理的不足,并提出了未来发展更强大的语言代理的具体方向。
Sep, 2023
通过对基于大语言模型的自主代理的综合调查,本文提出了一个统一框架来概括以往研究,并总结了在社会科学、自然科学和工程领域中应用大语言模型的人工智能代理的各种应用及评估策略。同时,我们还讨论了该领域的挑战和未来方向。
Aug, 2023
本文提出了一个多维分类法,旨在分析自主的 LLM 驱动的多智能体系统在根据建筑观点的各个方面(如目标驱动的任务管理、智能体组成、多智能体协作和上下文交互)之间如何平衡自主性和对齐的动态相互作用。它还包括一个指定基本建筑概念的领域本体模型。我们的分类法旨在使研究人员、工程师和 AI 从业者能够系统地分析这些日益普遍的 AI 系统所采用的建筑动态和平衡策略。所选择的代表性 LLM 驱动的多智能体系统的探索性分类说明了它的实际效用,并揭示了未来研究和开发的潜力。
Oct, 2023
通过利用大型语言模型(LLMs)的语言和推理能力,本研究提出了一个新的框架来增强自动驾驶车辆决策过程。通过在不同场景中进行试验和实时个性化示范,我们展示了利用 LLMs 能够改善驾驶决策、提供个性化驾驶体验并增强自动驾驶的安全和效果。
Oct, 2023
自动驾驶技术是改变交通运输和城市流动性的催化剂,从基于规则的系统过渡到基于数据驱动的策略。该研究论文系统地回顾了大型语言模型在自动驾驶领域的应用,并评估了当前技术进展、主要挑战和未来方向。
Nov, 2023
大型语言模型(LLMs)正在改变人工智能,使得自主代理能够在不同领域执行多样化任务。这些代理具备类似人类的文本理解和生成能力,有望在从客户服务到医疗保健等各个领域引发革命。然而,它们面临着诸如多模态、人类价值取向、幻觉和评估等挑战。推动、推理、工具利用和上下文学习等技术正在被探索,以增强它们的功能。像 AgentBench、WebArena 和 ToolLLM 这样的评估平台为在复杂场景中评估这些代理提供了强大的方法。这些进展正在引领更加有韧性和能力的自主代理的发展,预计它们将成为我们数字生活中不可或缺的一部分,协助我们完成从邮件回复到疾病诊断等任务。拥有 LLMs 带头的人工智能的未来充满了希望。
Apr, 2024
人工智能代理是一个前景光明的领域,利用大型语言模型作为基础构建通用人工智能代理带来了显著的进展,其在单一代理场景、多代理场景以及人机合作中的广泛应用展示了卓越的潜力,并为人类社会提供了有价值的见解。
Sep, 2023
研究通过构建自我认知指令提示池,评估大型语言模型的自我认知,并提出四个原则来量化模型的自我认知水平。结果显示在 Chatbot Arena 的 48 个模型中,有 4 个模型展示出可检测到的自我认知。模型规模、训练数据质量与自我认知水平之间存在正向相关关系。此外,研究还探索了自我认知状态下大型语言模型的效用和可信度,揭示了自我认知状态增强创造性写作和夸张等特定任务的能力。这项工作有望激发进一步研究大型语言模型的自我认知。
Jul, 2024
我们提出了一种从普通流程转变的方法,即通过引入大型语言模型作为认知代理,将人类智能融入自动驾驶系统,实现更加人性化的自动驾驶。我们的方法通过函数调用访问一个多功能工具库、具有常识和经验知识的认知记忆以进行决策制定,并且具备由思维推理、任务规划、动作规划和自我反思构成的推理引擎。在大规模 nuScenes 基准测试中,我们的 Agent-Driver 显著优于现有的自动驾驶方法,并且还表现出较强的可解释性和少样本学习能力。
Nov, 2023