一种面向可持续发展的人在环路优化自动形式化方法
该篇论文提出了一种名为 ``Formal-LLM'' 的新型框架用于基于 LLM 的代理,通过结合自然语言的表现力和形式语言的准确性,使规划过程具有控制性,从而防止代理生成无效和不成功的计划,并且通过实验验证了该框架在任务性能上取得的超过 50% 的整体性能提升,为在规划的有效性至关重要的应用场景中更广泛地利用 LLM 提供了可能性。
Feb, 2024
传统的优化与调度方案往往只考虑固定的系统要求,而未来的系统将采用用户驱动的方法和个性化服务,致力于实现高质量体验和灵活性。本文首次提出了一种新颖的资源调度架构,通过构建三个大语言模型代理来将任意用户的语音请求转化为资源分配向量。通过针对电动汽车充电的典型语音请求进行测试,结果表明所提出的架构的高效性。
Jun, 2024
应用大型语言模型的案例研究表明,模拟复杂人口群体在大型开放空间中的行为和热偏好,并将其集成到基于增强学习的代理 - 环境闭环算法中,可以在节能和居住者舒适性之间找到平衡,从而显示出远优于传统的设定点控制策略,这表明在 CPS-IoT 应用中实现自适应和个性化决策对于高效优化至关重要。
Mar, 2024
利用大型语言模型 (LLMs) 来自动调谐粒子加速器的能力,通过自然语言提示将粒子加速器的子系统调谐到最佳状态,并与贝叶斯优化 (BO) 和强化学习训练优化 (RLO) 算法进行性能比较。该研究的目标是加快自动调谐算法在粒子加速器的日常操作中的实际应用。
May, 2024
通过自动生成规则和提高适应性,AutoManual 框架使基于大型语言模型(LLM)的代理能够自主构建自身的理解并适应新的环境。在 ALFWorld 基准任务上,通过 GPT-4-turbo 和 GPT-3.5-turbo,AutoManual 显著提高了任务成功率,并生成了人可读的综合手册。
May, 2024
通过批判性利用大型语言模型(LLM)创建数字化代表不同利益相关者来规划共享自动化电动出行系统(SAEMS)的合成参与方法,本文介绍了一个在快速演变的移动技术多利益相关者环境中释放协同效应以解决城市交通问题的新方法。通过蒙特利尔案例研究的结果表明,这种结构化和可调参数的工作流程相较于单个 LLM 启用的专家代理生成的 SAEMS 计划,提供了具有较高可控性和综合性的输出。因此,该方法为改善多目标交通规划的包容性和可解释性提供了一条具有成本效益的途径,暗示了我们对可持续和公平交通系统的设想和战略的范式转变。
Apr, 2024
利用大型语言模型 (LLMs) 将自然语言描述转换为形式化规范的能力进行了评估,提出了一种使用两个 LLMs 与现成验证程序结合的方法来自动评估其翻译能力,结果显示目前最先进的 LLMs 无法充分解决这个任务,限制了它们在复杂系统设计中的实用性。
Mar, 2024
使用大型语言模型(LLM)和人在环循环人在植物物理系统(CPS)中探索将高水平提示转化为个性化行动计划,并随后将该计划转化为由实际物理系统控制器自动执行的推理序列决策,以达到控制目标。我们表明,将 LLM 置于上下文中使其能够生成领域特定的计划相对简单。然而,这些计划可能对物理系统来说无法执行,或对人类使用者来说不安全。因此,我们提出了 CPS-LLM,这是一个使用指令调整框架进行重新训练的 LLM,确保生成的计划不仅与 CPS 的物理系统动力学一致,而且对人类使用者来说是安全的。CPS-LLM 由两个创新组成部分组成:a)一种基于液态时常的神经网络物理动力学系数估计器,可以推导出带有一些未测量状态变量的动力学模型的系数;b)然后使用模型系数对使用动力学系统和相应模型系数体现的提示进行 LLM 训练。我们表明,当将 CPS-LLM 与如 BARD 等上下文化聊天机器人集成时,它可以生成可行且安全的计划,以管理被 1 型糖尿病患者使用的自动胰岛素输送系统的外部事件,如餐饮事务。
May, 2024
大型语言模型 (LLMs) 具有彻底改变自动形式化的潜力。引入数学编程语言 Lean4 为评估 LLMs 的自动形式化能力提供了前所未有的机会。本文介绍了一种专为 Lean4 设计的新型评估基准,将其应用于测试包括 GPT-3.5、GPT-4 和 Gemini Pro 在内的最先进的 LLMs 的能力。我们全面的分析发现,尽管最近有所进展,这些 LLMs 在自动形式化方面仍存在局限性,尤其是在更复杂的数学领域。这些发现强调了需要进一步发展 LLMs,以充分发挥它们在科学研究和开发中的潜力。本研究不仅为当前的 LLM 能力设立了基准,还为自动形式化的未来增强奠定了基础。
Jun, 2024
该论文介绍了一种创新方法,利用 Large Language Models(LLMs)作为模式识别工具来改善元启发式算法,并通过在基于社交网络的组合优化问题中进行测试,证明了该混合方法在解决方案质量方面优于现有的结合机器学习和元启发式算法的最新方法。通过精心设计提示,我们证明了从 LLMs 获得的输出可以用作问题知识,从而提高了结果。最后,我们承认 LLMs 的潜在缺点和限制,并认为进一步研究这方面的研究需要对其进行检验。
May, 2024