面向代理模拟器的干预一致替代模型

Dec, 2023

面向代理模拟器的干预一致替代模型

Interventionally Consistent Surrogates for Agent-based Simulators

Joel Dyer, Nicholas Bishop, Yorgos Felekis, Fabio Massimo Zennaro, Anisoara Calinescu...

TL;DR基于代理的模拟器提供复杂智能系统的细粒度表示，以直接模拟系统组成代理之间的交互。虽然它们的高保真性使得可以进行超局部政策评估和场景推测，但其大量计算成本限制了它们的广泛应用。本文中，我们利用因果抽象的最新发展，提出了一种用于学习在代理模拟器下具备干预一致性的替代模型的框架。我们的方法能够在复杂系统中快速针对政策干预进行实验，同时在感兴趣的干预下，以高概率使得替代模型行为与基于代理的模拟器保持一致。我们通过实证研究证明，在观测训练的替代模型中，会误判干预效果并引导决策制定者走向次优政策，而通过我们提出的方法进行干预一致性训练的替代模型能够在感兴趣的干预下与基于代理的模型行为非常接近。

Abstract

agent-based simulators provide granular representations of complex intelligent systems by directly modelling the interactions of the system's constituent agents. Their high-fidelity nature enables hyper-local policy evaluation and testing of what-if scenarios, but is associated with la

agent-based simulators surrogate models interventional consistency policy interventions complex systems

发现论文，激发创造

推进社会和健康计算科学中代理模型现状的先进替代方法的有前景且值得尝试的未来方向

该研究论文介绍了模型分析工具在实际大规模 ABMs（基于代理的模型）中的执行和运行性能问题，并提出了一些适用于非线性动力模型的替代模型，这些方法在社会健康计算科学领域尚未得到广泛运用，但在建立 ABMs 的替代模型方面可能是有用的。

Mar, 2024

利用机器学习代理进行代理模型校准

本文提出了一种新的方法，将监督机器学习和智能抽样结合起来，构建一个代理元模型来探索代理模型中的参数空间和校准。这种方法提供了一种快速而准确的模型行为近似方法，大大降低了计算时间，并有助于获取有关代理模型复杂运作的洞见。

Mar, 2017

预测模型模拟的代理限制

适应预测模型为基础的 AI 助手存在结构上的两个失败原因：自我暗示的错觉和预测 - 策略不一致。通过引入来自环境的反馈循环可以解决这两个问题，并验证了理论和实证分析的一致性。

Feb, 2024

生成代理：人类行为的交互模拟体

该论文介绍了一种通过扩展语言模型来实现生成代理的架构，生成的代理在交互中呈现出能够模拟真实人类行为和社交的表现。

Apr, 2023

使用干预学习自主代理端因果模型

本篇论文介绍了一种基于 agent assessment module 的 AI 系统执行高级指令序列并回答用户问题的方法，通过不同类别的查询来比较这种方法的计算要求和正确模型的学习所需的努力，并介绍了动态因果决策网络来捕捉 STRIPS-like 领域的因果结构。

Aug, 2021

具有保留属性和可调折衷的物理系统代理建模

本文提出了一种框架，旨在自动开发一系列物理系统的代理模型，以协助进行时间（模拟成本）和精度之间的平衡，其中包括从一级原理生成高保真模型并应用自下而上的模型降阶和利用实验或模拟数据拟合人工本构关系来生成代理模型。

Feb, 2022

可微分用户模型

本文介绍了一种通过不同 iable surrogates 来规避计算时间瓶颈的方法，这种方法可以使现代行为模型在线使用而无需考虑其计算成本，并且在计算时间上可以实现与无法似然推断方法相当的建模能力，最后，我们展示了如何使 AI 助手在先前研究过的菜单搜索任务中计算模型的可行性。

Nov, 2022

从隐式模型中挖掘金子，以改善无似然推理

介绍了一种新型的基于模拟的推断技术，在高维情况下，这种技术超越了传统的近似贝叶斯计算方法，并扩展了基于神经网络的代理模型的方法，并演示了这些新技术比传统方法更具样本效率和提供更高保真度的推断。

May, 2018

通过部分模拟的外推为模拟优化器提供非正式安全保证

自我监督学习是最先进的语言建模的基础。本文利用嵌入式智能体的笛卡尔框架模型，将单智能体世界扩展至多智能体世界，提出了一种名为 Cartesian object 的变体用于表示模拟，其中函数如令牌选择和模拟复杂性在模拟器的行为中进行了形式化，并通过 L"obian 障碍证明了通过设计检查模拟之间的一致性是不可能的。接着，提出了一种名为 Partial Simulation Extrapolation 的方案，旨在通过评估低复杂度的模拟来规避 L"obian 障碍。

Nov, 2023

可扩展的语义非马尔科夫模拟代理用于强化学习

最近的强化学习（RL）研究在各种应用中显示出很大的潜力，然而，可伸缩性、可解释性和马尔可夫假设等问题限制了其在某些领域的适用性。本文提出了一种基于时间扩展的注释逻辑的语义代理模拟器，与两个高保真度模拟器相比，我们展示了高达三个数量级的加速，同时保持学习策略的质量，并展示了对非马尔可夫动态和即时动作的建模和利用能力，同时提供可解释的轨迹来描述代理动作的结果。

Oct, 2023