- ICAL: 将轨迹转化为可行动洞见的多模态智能体的持续学习
我们提出了一种名为 In-Context Abstraction Learning(ICAL)的方法,通过从次优演示和人类反馈中构建多模态体验洞察记忆,将 VLMs 将轨迹抽象为一个通用程序,显著提高了检索增强的 LLM 和 VLM 代理的 - 在大型语言模型推理中平衡理性偏差和认知偏见:并非所有偏见均不好
通过研究大型语言模型(LLMs)的决策过程中的偏见,本研究揭示了不同偏见在决策过程中的微妙作用,并发现合适的平衡可以提高模型性能、改善决策准确性。我们引入了启发式调节和弃权选项的概念,并通过我们的研究结果表明,恰当缩放的偏见检查能够使 LL - MM运用主动推理建模可持续资源管理
主题:积极推理,自适应行为,决策制定,可持续资源管理和环境动态;总结:积极推理可在面对环境变化时产生可持续、有韧性的行为,并对可持续行为的理解和塑造具有潜力。
- LLM 不确定环境下的决策行为评估框架
在不确定性下做决策时,个体往往偏离理性行为,这可以通过风险偏好、概率权重和损失规避三个维度进行评估。本文提出基于行为经济学的框架,评估大型语言模型(LLMs)的决策行为,结果显示 LLMs 通常表现出类似于人类的行为模式,如风险规避和损失规 - ACL语言模型是可对齐的决策者:数据集和医疗分诊领域的应用
医学分级决策中的决策者属性的使用和大型语言模型作为道德决策者的应用研究。
- BOSC: 一款用于航空影像绘图的工具箱
BOSC 是一个能够提取具有前所未有的准确性和效率的运动洞察力的工具箱,解决了当今无人机和卫星资源丰富的关键需求,实现了对空中图像的精确和高效标注。
- 通过延迟策略学习改善空中和陆地移动机器人控制的泛化性能
通过延迟策略更新技术(DPU)对航空和陆地移动机器人进行的分析表明,这种技术极大地缓解了推广能力不足的问题,并加速了代理的学习过程,提高了它们在各种任务和未知场景中的效率。
- 数据驱动的业务流程管理的最新进展
基于数据的业务流程管理(Data-driven BPM)已成为一个相关研究领域,该论文呈现了关于数据驱动的 BPM 的研究见解。
- 意识定义:生物和人工通用智能的要求
意识被人们以客观术语定义极其困难,本文通过研究意识和决策行为的关系,从根本原则上生成了一个新的意识定义,其中要求包括感知能力、记忆存储、想象力和决策能力,丢失其中任何一个组成部分都将使意识思维的能力消失。
- 纹理引导的深度特征编码
通过纹理引导的特征压缩策略,该研究对机器视觉中的特征和纹理进行了调查和分析,提出了一种基于纹理特征的压缩策略,该策略通过选择性地压缩和传输与视觉任务相关的通道,同时为机器提供高质量的特征数据,并利用特征和纹理图像重建预览图像以支持人类决策。 - 基于自回归生成的后验采样
使用历史数据进行预训练的自回归模型,在新闻推荐任务中通过端到端微调预训练语言模型来处理新闻文章标题文本以提高性能,并在在线决策中展示了能够理解不确定性和主动收集信息以解决环境变化的新的学习算法框架。
- 基于扩散的离线强化学习中的长时程回滚动态模型
探索如何将扩散模型(DMs)的能力作为动力学模型在完全离线环境中解耦,以允许学习策略展开轨迹,并展示了 DyDiff 在离线强化学习中的有效性。
- ICML可配置镜像下降:决策制定的统一化
这篇论文旨在探索是否能开发一种单一算法以解决所有决策问题的分类。它通过引入广义镜像下降(GMD)、可配置镜像下降(CMD)和 GameBench 构建等方法来应对不同决策问题的挑战,并通过广泛的实验验证 CMD 在各个维度上对决策问题进行了 - 用于可解释和可争议决策的论证型大型语言模型
通过引入辩证推理方法,使用大语言模型(LLMs)构建论证框架,从而使 LLMs 的决策能够被自然地解释和争辩,通过在声称验证的决策任务中的实验,我们证明了辩论性 LLMs 的有效性,结果竞争力强于同类技术。
- 克服知识障碍:基于预训练世界模型的在线模仿学习
通过预训练和微调等方法,将计算机视觉和自然语言处理领域的成功范式引入到决策过程中已成为近年来越来越受欢迎的研究方向。本篇研究主要探讨了使用预训练模型进行观察性仿真学习,发现现有的方法在应对环境体验知识障碍和示范知识障碍方面存在局限,限制了其 - 跨领域强化学习的知识迁移:系统综述
通过对跨领域强化学习的了解和分类,以及对数据假设需求进行特征分析,本文全面系统地介绍了不同领域知识传递方法的研究,讨论了交叉领域知识传递的主要挑战以及未来研究方向。
- 基于结构信息原则的有效强化学习
该研究提出了一种基于结构信息原则的有效决策框架,通过信息论的视角,利用一种特定的无监督划分方法生成状态和动作的抽象表示,构建高效的转换图和编码树,引入了基于技能的学习机制,从而改善了单一智能体和多智能体强化学习算法的性能。
- 组合优化的图强化学习:调查与统一视角
图离散结构上关于决策制定方法的综合视角,通过采用强化学习算法解决图优化问题。
- 决策策略在混淆下的预测性能比较
我们提出了一种方法来比较决策策略的预测性能,该方法结合了因果推断和离线评估文献中的现代识别方法,并使用我们的框架在真实世界的医疗保险注册政策的预部署评估中进行了应用。
- STRUM-LLM:属性化和结构化的对比摘要
通过生成对比性摘要来解决用户在两个选项之间做决策时所面临的困难,STRUM-LLM 技术识别关键的差异属性,以及对用户决策最有影响力的特征。