语言化仿真引擎
本文描述了一个支持扩展多模态交互的系统,通过使用大型语言模型 (LLMs) 将用户的英语语句映射到领域特定的代码,我们探索了 LLMs 在上下文敏感性方面捕捉演算发言者意图的程度。
Oct, 2023
综述了利用大型语言模型进行基于代理的建模和仿真的现状、挑战和未来发展方向,并提供了大型语言模型 - 基于代理的建模和仿真在实际环境和虚拟环境中的最新研究成果。
Dec, 2023
为了推动自动化任务导向对话系统的评估,本研究提出了一种基于预训练语言模型的新型用户模拟器,并通过上下文学习来生成具有鲁棒性和语言多样性的输出,以模拟人类对话行为。通过与现有对话系统交互,并收集人机交互数据集,验证了该用户模拟器在单一意图对话目标方面的表现与人类相似。
Sep, 2023
通过介绍一种新的多用途无仿真测试平台 LangSuitE 以及一种新的思维链式 (schema) EmMem 来评估大型语言模型在动态交互环境中作为少样本或零样本具有实体的智能体的效果和挑战,该研究对于建立语言模型背景下的具有实体特征的普适性智能体代表了重要的进展。
Jun, 2024
通过五项任务评估语言模型在对话推荐中模拟人类行为的效果,研究发现基准模拟器的评估可以揭示语言模型与人类行为的差异,并提供了模型选择和提示策略的见解。
Mar, 2024
用于仿真建模的学习框架中,使用语言作为接口与底层系统相互联系。我们称系统的语言描述为 “System Caption” 或 “SysCap”。通过使用大型语言模型 (LLMs) 来合成高质量的描述,我们解决了自然语言 SysCaps 与仿真运行数据配对的缺乏。在我们的框架下,我们针对两个复杂能源系统的真实世界模拟器训练了多模态文本和时间序列回归模型。我们的实验表明,设计面向真实世界代理模型的语言接口具有与标准基线相当的准确性。我们以定性和定量的方式展示了 SysCaps 解锁了基于文本提示的代理模型和超越以往可能性的新的泛化能力。我们将发布生成的 SysCaps 数据集和支持后续研究的代码。
May, 2024
使用大型语言模型构建的用户搜索行为模拟器在查询生成方面优于现有方法,并在预测用户点击和停止行为方面可与传统方法媲美。这些结果不仅验证了使用大型语言模型进行用户模拟的有效性,还为更强大和通用的用户模拟器的开发提供了启示。
Mar, 2024
该研究论文介绍了一种名为 LCTGen 的模型,它结合了大型语言模型和基于变压器的解码器架构,利用语言作为动态交通场景生成的监督来源,其在无条件和条件下的交通场景生成方面表现优于之前的研究,并且在现实感和保真度方面更好。
Jul, 2023
安装概率世界模型到人工智能代理中,为人类与控制这些代理打开了一个高效的交流途径;我们开发了一种名为语言引导的世界模型(LWMs),通过阅读语言描述来捕捉环境动态,提高了代理的通信效率,同时允许人类用简洁的语言反馈在多个任务中同时改变行为。该研究证明了当前最先进的 Transformer 架构在该基准测试上表现不佳,激励我们设计更强大的架构。通过模拟展示了我们提出的 LWMs 的实用性,使代理能够在执行前生成和讨论计划,增强了代理的可解释性和安全性,并使其在真实环境中的性能提高了三倍,而无需在该环境中进行任何交互式经验的收集。
Jan, 2024
DuetSim 是一个利用大型语言模型的创新框架,通过采用两个语言模型来生成任务导向的对话,既增加了回答的多样性又提高了准确性,通过在 MultiWOZ 数据集上的实验证实了其效果。
May, 2024