CGMI: 配置化通用多智能体交互框架
我们提出了一种新型基础设施,名为 MindAgent,用于评估游戏交互中的规划和协调能力,并引入了新的游戏场景和相关基准,以评估多智能体协作效率。我们使用新的自动度量 CoS 进行全面评估。我们希望我们对大型语言语料库学习的 LLMs 以及用于通用调度和协调的新基础设施的发现能够揭示如何获取这些技能的一些见解。
Sep, 2023
利用 LLMs 在复杂的电脑游戏环境中赋予游戏智能体人类般的决策能力,以推进人工智能 (AGI) 的发展,并提供了 LLM 基础的游戏智能体的综述,包括感知、记忆、思考、角色扮演、行动和学习的六个关键组成部分,调研了六种游戏类型的现有代表性 LLM 基础游戏智能体,并展望了未来的研究和发展方向。
Apr, 2024
我们提出了一种全面认知的大型语言模型代理,CoCo-Agent,通过全面环境感知和条件化行动预测的两种新方法系统地提高了图形用户界面自动化性能。我们的代理在 AITW 和 META-GUI 基准测试中取得了最新的最佳表现,展示了在现实场景中的巨大潜力。
Feb, 2024
Agent-based modeling has evolved with the integration of Large Language Models (LLMs) to create Generative Agent-Based Models (GABMs) facilitated by Concordia, enabling language-mediated simulations in physically or digitally grounded environments.
Dec, 2023
这项研究介绍了一个专门用于评估大型语言模型在多主体环境中能力的基准测试框架,通过游戏和博弈论场景来创建不同的测试环境,并利用概率图模型方法增强模型的导航能力,最终量化评估了七种不同大型语言模型的能力,发现最强模型 GPT-4 和最弱模型 Llama-2-70B 之间存在三倍的能力差距,同时证实了概率图模型增强了所有模型的能力,平均提高了 50%。
Nov, 2023
利用生成式人工智能建立反馈丰富的社会系统计算模型,通过生成代理基于模型(GABMs),将人类决策过程在社会环境中进行模拟,并探讨了社会规范扩散的一种简单 GABM 模型,以及该模型在不同情境下的敏感性和重要性。
Sep, 2023
本研究探讨了多学科方法在测试和调整人工通用智能(AGI)和 LLMs 方面的潜力。通过在虚拟现实框架中采用基于模拟的多智能体系统,模拟真实世界环境中的复杂社会结构和相互作用,通过应用社会学、社会心理学、计算机科学、物理学、生物学和经济学等领域的各种理论,展示了实现更具人类对齐和社会责任的 AGI 的可能性。该研究旨在为 AGI 的开发和改进做出贡献,强调社会、伦理和理论维度的整合以供未来研究参考。
Dec, 2023
本研究介绍了 CogAgent,这是一个在 GUI 理解和导航方面专门使用的 180 亿参数的视觉语言模型,通过低分辨率和高分辨率图像编码器,支持 1120*1120 分辨率的输入,能够识别微小的页面元素和文本。CogAgent 在五个文本丰富和四个通用的 VQA 基准测试中达到了最新的技术水平,在 PC 和 Android 的 GUI 导航任务中超过了 LLM 方法,从而推动了技术的发展。
Dec, 2023
将生成式 AI(GenAI)和大型语言模型(LLMs)应用于教育可以提高教学效率,丰富学生学习。使用当前的 LLM 涉及到会话式用户界面(CUIs)用于生成材料或提供反馈,但这带来了教育者在 AI 和 CUI 领域的专业知识需求、高风险决策的道德问题以及隐私风险。为了解决这些问题,我们建议从 CUIs 过渡到通过 API 调用利用 LLMs 的用户友好应用程序。我们提出了一个将 GenAI 道德地融入教育工具的框架,并展示了其在我们的工具 Feedback Copilot 中的应用,该工具为学生作业提供个性化反馈。我们的评估结果显示了这种方法的有效性,对 GenAI 研究人员、教育者和技术人员具有重要意义。这项工作为教育中的 GenAI 未来制定了一条路线。
Apr, 2024