利用大型语言模型进行集体决策
通过将大型语言模型(LLMs)组织成以社区为基础的结构,该论文介绍了一种变革性方法,旨在增强 LLMs 的集体智能和问题解决能力。本文研究了不同的组织模型 - 分层、扁平、动态和联邦,每种模型都具有协作人工智能系统的独特优势和挑战。在这些结构化社区中,LLMs 被设计为专门从事不同的认知任务,采用直接通信、投票系统和基于市场的方法等先进的交互机制,并动态调整其治理结构以满足不断变化的需求。这种社区的实施对于提高人工智能的问题解决能力具有重大潜力,因此有必要深入研究其伦理考虑、管理策略和可扩展性。本文旨在为未来研究奠定基础,主张在人工智能研究和应用中从孤立到协同的运行框架进行范式转变。
May, 2024
通过调查大型语言模型(LLMs),特别是 OpenAI 的 GPT4 和 LLaMA2 的选举行为及其与人类选举模式的一致性,本研究通过人类投票实验和与 LLM 代理人的平行实验,着重研究了集体结果和个人偏好,揭示了人类和 LLMs 在决策和固有偏见方面的差异。我们发现 LLMs 在偏好多样性和一致性之间存在一种权衡,倾向于相对人类选民多样化的选择,这表明在投票辅助中使用 LLMs 可能导致更趋同的集体结果,强调了谨慎将 LLMs 整合到民主进程中的必要性。
Jan, 2024
研究使用大规模语言模型(LLMs)驱动的多 Agent 系统在协作中解决复杂任务的能力。主要考虑多 Agent 协作中的一个基本问题:共识寻求。通过 Agent 间的协商,研究了一个寻求共识的任务,其中每个 Agent 的状态是数字值,他们彼此协商达成共识值。发现,当没有明确指导应采用哪种策略时,LLM 驱动的 Agent 主要使用平均策略寻求共识,尽管偶尔也会使用其他策略。此外,分析了 Agent 数量、Agent 个性和网络拓扑对协商过程的影响。研究结果为理解 LLM 驱动的多 Agent 系统在解决更复杂任务方面的行为奠定了基础。除此之外,将 LLM 驱动的共识寻求应用于多机器人聚合任务,展示了 LLM 驱动的 Agent 在多机器人协作任务中实现零次规划的潜力。项目网址: westlakeintelligentrobotics.github.io/ConsensusLLM/。
Oct, 2023
本研究利用自省式提示 (Introspective Tips) 促进了大型语言模型 (Large Language Models) 的自我优化,从学习过程中的经验、集成专家演示和跨越多种游戏等三种方面提高决策性能,却不调整 LMM 参数,结论在 TextWorld 超过 100 个游戏中都表现出优异的结果。
May, 2023
通过利用 TensorFlow 生成模型(LLMs)预测个体偏好和整体偏好,我们对 2022 年巴西总统选举期间收集的 67 项政策提案的数据进行训练和测试,发现 LLMs 在个体层面上的预测准确率为 69% 到 76%,并对自由派和大学教育程度较高的参与者有明显的优势;在整体层面上,借助 Borda score 对偏好进行汇总,我们发现通过 LLMs 进行增强的数据能够更好地预测整个参与人群的偏好,尤其是在随机样本仅代表总人口不超过 30% 到 40% 的情况下,这些结果表明 LLMs 在增强民主系统的构建中具有潜在的用途。
May, 2024
通过批判性利用大型语言模型(LLM)创建数字化代表不同利益相关者来规划共享自动化电动出行系统(SAEMS)的合成参与方法,本文介绍了一个在快速演变的移动技术多利益相关者环境中释放协同效应以解决城市交通问题的新方法。通过蒙特利尔案例研究的结果表明,这种结构化和可调参数的工作流程相较于单个 LLM 启用的专家代理生成的 SAEMS 计划,提供了具有较高可控性和综合性的输出。因此,该方法为改善多目标交通规划的包容性和可解释性提供了一条具有成本效益的途径,暗示了我们对可持续和公平交通系统的设想和战略的范式转变。
Apr, 2024
通过 fine-tuning 机制,使用大型语言模型生成众人认可的共识性议论,以协调多样化的人类意见,并发现从子集中生成的共识性声明提高了个体贡献,并能够被人类用户所接受,具有较强的差异性和普适性。
Nov, 2022
这篇文章着重探讨了大型语言模型对人类价值、劳动力市场的影响以及需不需要对它们进行监管等问题,同时,它们也能更好地人性化技术,并且可以克服当前技术所面临的瓶颈问题。因此,我们应该更广泛地了解和推广 LLMs 以及简化 LLMs 使用的工具和方法。
May, 2023
本文通过在线实验的方式,从用户的角度探讨了使用大型语言模型(LLMs)进行个性化电影推荐的有效性。研究结果显示,LLMs 提供较强的推荐解释能力,但缺乏整体个性化、多样性和用户信任。此外,不同的个性化提示技术对用户感知的推荐质量影响不大,而用户观看的电影数量起到了更重要的作用。与此同时,LLMs 展示了更好地推荐知名度较低或小众化电影的能力。通过定性分析,我们发现与用户交互体验中的积极和消极关联的关键对话模式,并得出结论:为了获得高质量的 LLMs 推荐,提供个人背景和示例至关重要。
Apr, 2024