LLMSat: 大型基于语言模型的面向目标的自主空间探测智能体
基于大型语言模型 (LLM) 的代理机制在航天领域中发挥重要作用,首次将 LLM 代理引入航天研究,通过提示工程、少样本提示和微调技术开发了有效的 LLM 代理,并在挑战赛中获得第二名。
Mar, 2024
通过对基于大语言模型的自主代理的综合调查,本文提出了一个统一框架来概括以往研究,并总结了在社会科学、自然科学和工程领域中应用大语言模型的人工智能代理的各种应用及评估策略。同时,我们还讨论了该领域的挑战和未来方向。
Aug, 2023
大型语言模型(LLMs)正在改变人工智能,使得自主代理能够在不同领域执行多样化任务。这些代理具备类似人类的文本理解和生成能力,有望在从客户服务到医疗保健等各个领域引发革命。然而,它们面临着诸如多模态、人类价值取向、幻觉和评估等挑战。推动、推理、工具利用和上下文学习等技术正在被探索,以增强它们的功能。像 AgentBench、WebArena 和 ToolLLM 这样的评估平台为在复杂场景中评估这些代理提供了强大的方法。这些进展正在引领更加有韧性和能力的自主代理的发展,预计它们将成为我们数字生活中不可或缺的一部分,协助我们完成从邮件回复到疾病诊断等任务。拥有 LLMs 带头的人工智能的未来充满了希望。
Apr, 2024
自动驾驶的进化取得了显著的进展,并成为了一个实际存在的现实。为了确保自动驾驶系统符合用户意图,准确辨别和解释用户指令尤其是在复杂或紧急情况下是至关重要的。为了实现这一目标,我们提出利用大型语言模型(LLMs)的推理能力,从车载用户的指令中推断系统需求。通过一系列实验,包括不同的 LLM 模型和提示设计,我们探索了通过自然语言文本指令从少量样本进行多元二值分类的精确度。我们确认 LLM 可以理解和推理提示,但强调其有效性取决于 LLM 模型的质量和适当的连续提示的设计。代码和模型可在以下链接找到:https://github.com/KTH-RPL/DriveCmd_LLM。
Nov, 2023
这是第一项研究应用大语言模型(LLMs)进行自动规划任务模型空间编辑的工作。我们探索了 AI 规划文献中研究的两种不同类型的模型空间问题,以及 LLM 对这些任务的影响。我们通过实验证明了 LLM 的性能与组合搜索(CS)的对比情况,以及 LLM 作为独立模型空间推理器以及作为与 CS 方法结合的统计信号的双阶段过程的一部分时的性能。我们的实验结果表明,LLM 在未来进一步探索规划任务中的模型空间推理的前景很有希望。
Nov, 2023
使用大型语言模型(LLMs)作为多个专家代理系统,通过在零样本、少样本、上下文引导提示的情况下启动 LLMs 的灵活性,我们试图解决抽象和推理语料库(ARC)挑战。通过将输入图像转换为多个适合的基于文本的抽象空间,我们利用 LLMs 的联想能力推导出输入输出关系,并将其映射到工作程序形式的行动,类似于 Voyager / Ghost in the MineCraft。此外,我们使用迭代环境反馈来指导 LLMs 解决任务。我们的方法在训练集问题的 111 个问题中实现了 50 个解决方案(45%),仅使用三个抽象空间 - 网格、对象和像素。我们相信通过更多的抽象空间和可学习的行动,我们将能够解决更多问题。
Oct, 2023
基于大型语言模型(LLM)的多智能体系统在复杂问题解决和世界模拟中取得了重大进展,我们提供了一份综述,深入讨论了基于 LLM 的多智能体系统的基本方面和挑战。
Jan, 2024
从理论角度出发,研究大型语言模型在物理世界中解决决策问题的原因,通过层次化强化学习模型,证明预先训练的大型语言模型规划器通过上下文学习有效地进行贝叶斯聚合模仿学习,并引入探索策略避免线性遗憾。扩展该理论框架应用于环境的过渡模型推断和多智能体协调等场景。
May, 2024
本文提出将大型语言模型(LLMs)融入多智能体系统(MASs)中来实现其自适应,并通过一个基于 MAS 的应用进行实践说明,从而为 MAS 的自适应提供新的范式。
Jul, 2023
本研究介绍了一种使用预训练语言模型(LM)的语言模型增强的自我目标学习环境,它支持自动生成并学习具有多样性、抽象性、与人类相关的目标 —— 而非手动编码的目标表示、回报函数或课程,该系统可以在基于文本的任务无关环境中学习掌握各种广泛的技能。
May, 2023