- 准确预测与糟糕决策之间:AI/ML 差距
智能代理依赖人工智能 / 机器学习功能来预测可能行动的后果并优化策略。然而,过分追求预测准确性忽视了对效用的准确可靠评估,导致期望效用与实际影响之间存在重大差距。该研究通过量化效用不确定性和概率估计对预期效用的敏感性,比较两者的影响,提出从 - 实体演绎竞技场:探索 LLM 的对话推理和规划能力的游乐场
大语言模型在回答清楚的问题方面非常有效,但面对模糊查询时会表现不可预测且产生错误的输出,因此需要开发能够提出澄清问题来解决模糊性的智能代理。本文提供了一个评估框架,通过问法官一系列问题来推断一个未知的实体并评估语言模型的会话推理和规划能力, - 用大型语言模型解释代理行为
智能代理通过观察状态和行为生成自然语言解释,以理解其行为,从而促进与用户的互动。
- MM建构语法与人工智能
此篇研究论文旨在阐述建构语法与人工智能之间的关系,并探讨它们在语言研究和智能代理构建领域中的相互影响和重要性。
- 使用回答集编程对自主代理进行惩罚框架
该论文提出了一个框架,用于对不遵守授权或义务政策的智能体进行处罚,在一个动态环境中进行推理。框架可以表示和推理与计划相关的处罚,并提出了一个算法,根据智能体在授权和义务政策方面的遵从程度来对其行为进行处罚。论文指出,除非有拯救人类生命等紧急 - 用多智 - Agent 强化学习从零开始学习网络防御策略
深度学习技术的最新进展为自主网络防御的设计提供了新的可能性,智能代理团队在计算机网络防御角色中可能揭示了保护网络和运动资产的有希望的途径,该研究对比了基于价值的独立学习和集中训练去中心化执行的合作多代理强化学习方法,表明这两种方法都优于简单 - ActiveAI:以目标为导向的情境学习,为中学生引入人工智能素养
ActiveAI 项目通过提供基于 AI4K12 知识框架的有趣的 AI 素养学习体验,解决了 7-9 年级学生在人工智能教育中所面临的关键挑战。该应用程序利用目标导向场景、即时反馈、项目式学习和智能代理等学习科学机制,结合滑块、步进器和收 - NEOLAF,一种由 LLM 驱动的神经符号认知架构
该研究论文提出了 NEOLAF(Never Ending Open Learning Adaptive Framework)这一集成的神经符号认知架构,它在建模和构建智能代理方面超越了纯连接主义和纯符号主义的方法,具备可解释性、增量学习、效 - 6G 网络商业支持系统
6G BSS 系统的全面视野、潜在关键技术和功能架构,以及从 5G 到 6G 的演进路线和技术前景。
- MM基于时间并发语言的交错语义用于建模辩论和对话游戏
本文介绍一种语言,可用于建模智能体之间的并发交互,并允许指定特定操作发生的时间间隔,以及演示了如何使用该语言建模辩论和对话游戏。
- Minecraft 中的幽灵:基于大型语言模型、文本知识和记忆的开放世界环境通用智能体
介绍了一种新的框架 Ghost in the Minecraft (GITM),它将大型语言模型和基于文本的知识和记忆相结合,旨在在 Minecraft 中创建具有普适性的智能体,并在这一框架下通过使用结构化动作和大型语言模型成功的提高了 - 从单幅图像理解 3D 物体交互
本文提出一种基于 Transformer 的模型以实现机器的多物体理解,物体控制及 3D 场景探索,主要方法为预测物体的 3D 位置,物理属性及可访问性,通过自己收集和验证数据集来证明该模型对网络视频,比如第一人称视角视频和室内图像产生较好 - 高水平机器人解释的奖励分解探究
本文提出利用抽象动作和奖励分解技术的可解释学习框架,使得机器人动作的解释更易于人类理解,并通过两个场景的定量和定性分析,展示了该框架的有效性。
- 履行职责,保障权益
本文研究了智能代理应该如何配备权利以满足它可以选择执行的任务,并通过 LTLf 合成进行了实现。我们证明了处理权利并不会使合成过程变得更加困难,但需要一个比标准 LTLf 合成更复杂的解决方案概念。
- 基于语言引导的仿真学习任务适应
本研究提出了一种新的任务学习方式,即通过自然语言表述来传递任务间的区别,以实现重用其他任务的演示,并使用 transformer-based 模型来理解实体之间的关系以学习目标任务,并构建了 Room Rearrangement 和 Roo - 谈判对话系统综述
综述谈判对话系统中的最新成果,分析其评估与方法学现状,并讨论多模态、多方和跨文化谈判场景等未来研究方向,以期为研究者提供系统性的概述和启发。
- 评估 3D 迷宫中的长期记忆
本文介绍了 Memory Maze,这是一个专门设计用于评估智能体长期记忆的三维随机迷宫领域,包括在线的强化学习基准测试、离线数据集和离线探测评估。我们发现当前算法在小迷宫上的表现很好,但在大迷宫上还不及人类表现,未来有待进一步进行算法设计 - 有限理性代理人的决策制定
通过将有限理性概念与信息论观点相结合,将其融入博弈论框架中以预测自己及其它机器人或人类邻近代理的行为以及在其计算限制下采取行动,模拟与实际实验都证明这种方法可以帮助机器人推理其他代理的不同智能水平并计算出合理的策略。
- EgoTaskQA:理解自我中心视频中的人类任务
通过问题回答对现实生活中的个人行为视频进行对话式任务理解,以制定 EgoTaskQA 基准,并在其中对最先进的视频推理模型进行评估,以此引导视觉界朝着面向目标的视频理解和推理的方向前进。
- 通过多任务学习实现相对方向根据的全面 VQA 数据集:早期确定 “正确性” 含义
本文介绍了一种基于抽象物体的新型诊断性视觉问答数据集 GRiD-A-3D,以分析端到端 VQA 模型在相对方向上的地面能力的细粒度。同时,该数据集相对于现有数据集需要更少的计算资源,但具有相当甚至更高的性能。通过基于 GRiD-A-3D 训