CGMI: 配置化通用多智能体交互框架

Aug, 2023

CGMI: 配置化通用多智能体交互框架

CGMI: Configurable General Multi-Agent Interaction Framework

Shi Jinxin, Zhao Jiabao, Wang Yilei, Wu Xingjiao, Li Jiawen...

TL;DR我们提出了可配置的通用多代理交互（CGMI）框架，以模拟真实场景中的人际互动。通过使用 CGMI 框架，我们模拟了教师和学生之间的多个课堂互动，实验结果表明教学方法、课程和学生表现等方面与真实课堂环境密切相关。

Abstract

Benefiting from the powerful capabilities of large language models (LLMs), agents based on LLMs have shown the potential to address domain-specific tasks and emulate human behaviors. However, the content generate

large language models agents cognitive architecture virtual environment classroom interactions

发现论文，激发创造

MindAgent：新兴游戏互动

我们提出了一种新型基础设施，名为 MindAgent，用于评估游戏交互中的规划和协调能力，并引入了新的游戏场景和相关基准，以评估多智能体协作效率。我们使用新的自动度量 CoS 进行全面评估。我们希望我们对大型语言语料库学习的 LLMs 以及用于通用调度和协调的新基础设施的发现能够揭示如何获取这些技能的一些见解。

Sep, 2023

多智能体协作：发挥智能 LLM 代理的力量

本文提出了一种通过多智能体系统来增强大型语言模型（LLMs）能力的新框架，并通过人工智能领域的案例研究展示了这一框架的实用性和多样性。

Jun, 2023

基于大型语言模型的游戏智能代理调查

利用 LLMs 在复杂的电脑游戏环境中赋予游戏智能体人类般的决策能力，以推进人工智能 (AGI) 的发展，并提供了 LLM 基础的游戏智能体的综述，包括感知、记忆、思考、角色扮演、行动和学习的六个关键组成部分，调研了六种游戏类型的现有代表性 LLM 基础游戏智能体，并展望了未来的研究和发展方向。

Apr, 2024

智能手机图形用户界面自动化的综合认知 LLM 代理

我们提出了一种全面认知的大型语言模型代理，CoCo-Agent，通过全面环境感知和条件化行动预测的两种新方法系统地提高了图形用户界面自动化性能。我们的代理在 AITW 和 META-GUI 基准测试中取得了最新的最佳表现，展示了在现实场景中的巨大潜力。

Feb, 2024

基于 Concordia 的将行动植根于物理、社交或数字空间的生成式基于代理的建模

Agent-based modeling has evolved with the integration of Large Language Models (LLMs) to create Generative Agent-Based Models (GABMs) facilitated by Concordia, enabling language-mediated simulations in physically or digitally grounded environments.

Dec, 2023

MAgIC: 大型语言模型驱动的多智能体在认知、适应性、合理性和协作方面的基准测试

这项研究介绍了一个专门用于评估大型语言模型在多主体环境中能力的基准测试框架，通过游戏和博弈论场景来创建不同的测试环境，并利用概率图模型方法增强模型的导航能力，最终量化评估了七种不同大型语言模型的能力，发现最强模型 GPT-4 和最弱模型 Llama-2-70B 之间存在三倍的能力差距，同时证实了概率图模型增强了所有模型的能力，平均提高了 50%。

Nov, 2023

生成代理基于建模：通过将机械模型与生成人工智能相结合揭示社会系统动力学

利用生成式人工智能建立反馈丰富的社会系统计算模型，通过生成代理基于模型（GABMs），将人类决策过程在社会环境中进行模拟，并探讨了社会规范扩散的一种简单 GABM 模型，以及该模型在不同情境下的敏感性和重要性。

Sep, 2023

CERN 用于 AGI：自主模拟为基础的人工智能测试和对齐的理论框架

本研究探讨了多学科方法在测试和调整人工通用智能（AGI）和 LLMs 方面的潜力。通过在虚拟现实框架中采用基于模拟的多智能体系统，模拟真实世界环境中的复杂社会结构和相互作用，通过应用社会学、社会心理学、计算机科学、物理学、生物学和经济学等领域的各种理论，展示了实现更具人类对齐和社会责任的 AGI 的可能性。该研究旨在为 AGI 的开发和改进做出贡献，强调社会、伦理和理论维度的整合以供未来研究参考。

Dec, 2023

CogAgent：GUI 代理的视觉语言模型

本研究介绍了 CogAgent，这是一个在 GUI 理解和导航方面专门使用的 180 亿参数的视觉语言模型，通过低分辨率和高分辨率图像编码器，支持 1120*1120 分辨率的输入，能够识别微小的页面元素和文本。CogAgent 在五个文本丰富和四个通用的 VQA 基准测试中达到了最新的技术水平，在 PC 和 Android 的 GUI 导航任务中超过了 LLM 方法，从而推动了技术的发展。

Dec, 2023

大型语言模型与用户界面相遇：反馈供应案例

将生成式 AI（GenAI）和大型语言模型（LLMs）应用于教育可以提高教学效率，丰富学生学习。使用当前的 LLM 涉及到会话式用户界面（CUIs）用于生成材料或提供反馈，但这带来了教育者在 AI 和 CUI 领域的专业知识需求、高风险决策的道德问题以及隐私风险。为了解决这些问题，我们建议从 CUIs 过渡到通过 API 调用利用 LLMs 的用户友好应用程序。我们提出了一个将 GenAI 道德地融入教育工具的框架，并展示了其在我们的工具 Feedback Copilot 中的应用，该工具为学生作业提供个性化反馈。我们的评估结果显示了这种方法的有效性，对 GenAI 研究人员、教育者和技术人员具有重要意义。这项工作为教育中的 GenAI 未来制定了一条路线。

Apr, 2024