- 马尔可夫决策过程的鲁棒奖励设计
回报设计问题研究了领导者与追随者之间的相互作用,其中领导者通过修改追随者的奖励函数来塑造追随者的行为以最大化领导者的回报。现有的奖励设计方法依赖于准确模拟追随者对奖励调整的反应,而这可能对模型不准确性敏感。为了解决这个敏感性问题,我们提出了 - 交互式机器人学习中联合模态的力量
研究通过探索机器人学习与人类互动,并研究多元输入模式对学习结果的影响,引入了 “元模态” 这一概念,包含了传统偏好和标量反馈机制之外的其他反馈形式,不同于以往仅关注于单个元模态的研究,本研究评估了它们在学习结果上的综合效应,研究发现,虽然单 - ScrewMimic: 人类视频中的螺旋空间投影双手模仿
利用人类示范视频和自我监督策略微调,我们提出了一种名为 ScrewMimic 的框架,通过将两只手之间的相互作用建模为串行运动链形式进行双手操作,从而实现机器人学习双手操作行为。实验结果表明,ScrewMimic 能够从单个人类示范视频中学 - LLM 驱动的游戏叙事中的玩家驱动新生
通过与大型语言模型的互动,玩家能够参与游戏叙事的演化,发现有趣且具有吸引力的新节点,进而创造出非原始叙事中不存在的内容。
- 语义单元:获取物品感知多样性的进化过程
用分布式表示构建多义词语义向量,通过与其他向量交互演化而成,研究结果显示,具有较大或中等方差的词在文本中较容易解释,而通过与不同地壳区域交互获得更大方差的震中可能对应即将发生的大地震震中。
- 量子电路 C*- 代数网络
该论文介绍了量子电路 $C^*$- 代数网络,通过 $C^*$- 代数,我们可以将量子门表示为神经网络的权重参数,通过引入额外的参数,我们可以在多个由量子门构成的电路之间引发交互,这种交互可以使电路之间共享信息,从而提高机器学习任务中的泛化 - 绘制与理解:利用视觉提示使 MLLMs 能够理解您想要的内容
我们介绍了 Draw-and-Understand 项目,其中包括一种新的多模域数据集和一种具有挑战性的视觉提示基准测试。我们提出了 SPHINX-V,一种新的端到端训练的多模域大型语言模型,用于连接视觉编码器、视觉提示编码器和语言理解模型 - 走向全面多模感知:引入触觉 - 语言 - 视觉数据集
通过人机级联协作构建了一个名为 TLV(触觉 - 语言 - 视觉)的触觉 - 语言 - 视觉数据集,其中包含用于多模态对齐的句级描述。利用该新数据集,使用我们提出的轻量级训练框架 TLV-Link(通过对齐链接触觉、语言和视觉)进行微小参数 - 我思故我在:大型语言模型中的意识
大型语言模型是否具有类似于人类的任何形式的知觉?本文介绍了将知觉概念引入到大型语言模型中,认为知觉是增强大型语言模型与人类互动并确保其道德回应的重要方面。我们定义大型语言模型的知觉为其作为 AI 模型感知和理解自己,以及展现社交智能的能力。 - Human101:从 1 个视角在 100 秒内训练 100+FPS 的人类高斯分布模型
用 3D 高斯分布的先进技术在短时间内实现高保真度的动态 3D 人体重建,并提供实时渲染和交互能力。
- 自动驾驶车辆在全自动和混合交通条件下的开发与评估
自动驾驶汽车技术快速发展,对道路交通安全产生了重大影响,同时也解决了多种复杂的交通问题。为了确保自动驾驶汽车之间以及自动驾驶汽车与人类驾驶员之间的合作互动,本研究提出了一个多阶段的方法,采用共享和关怀的车对车通信策略来加强协同行为。通过进行 - 您的可解释人工智能有多信息?一项决策评估任务来客观衡量解释的好处
在这篇论文中,我们通过提出一个评估任务来客观并定量地衡量可解释人工智能系统在信息交互中提供给用户的信息能力,并计划在人机决策任务中比较两种 XAI 技术,以深入理解是否用户中心的方法比传统方法更具信息性。
- InterControl:通过控制每个关节生成人类动作交互
模型 InterControl 利用大型语言模型规划器将人的交互描述转化为接触计划,通过基于接触计划的空间可控运动生成方法实现交互生成,进而实现对每个人的每个关节的灵活空间控制。
- 必要时澄清:通过与语言模型的交互解决多义性
我们提出了一个任务无关的框架来通过询问用户澄清问题来解决模型中的歧义,我们的方法在确定何时需要澄清、确定要问的澄清问题以及通过澄清获得的新信息方面都取得了显著成果,并对模型的不确定性进行了估计,我们的方法在准确识别需要澄清的预测方面始终优于 - 互动语言中的问题和失败:朝向语言学知识驱动的分类学
本研究旨在介绍一种系统的研究议程,旨在理解人类与人工会话代理之间的相互作用的本质(即人机交互,HMI),具体来说,我们将采取明确的语言学角度,重点关注已知影响人类对话流程的语言学定义变量(即人与人之间的交互,HHI)。
- 学习交互式实景仿真器
通过生成模型学习一个真实世界互动的通用模拟器 (UniSim),以模拟高级指令和低级控制的可视结果,并用于训练高级视觉 - 语言规划器和低级增强学习策略,实现纯粹从学习的真实世界模拟器中的零样本现实世界转移。
- 追溯一个联盟的输入变量归因
从全新的角度,本文旨在开发一种新的归因方法,以解释个体变量的归属和联合归属之间的冲突。通过重新分配交互作用,我们将 Shapley 值扩展到联合归属,并推导出该冲突的基本机制,该冲突来自于联合中包含部分变量的交互作用。
- AAAI多层级组合推理的互动指令跟随
使用多层次组合推理代理(MCR-Agent)将任务分解为多个子目标,分别处理导航和交互,实现了对复杂任务的有效执行,并在效率指标上相较于现有技术获得了 2.03%的绝对增益,无需使用基于规则的计划或语义空间记忆。
- 最小充分机器人大脑的数学特征化
本文研究了通过内部系统(机器人算法或软件)与外部系统(机器人本体及其环境)之间的交互所获取信息的编码和处理的下限,算法或软件的最弱内部系统能够实现被动(过滤)和主动(规划)任务,并介绍了信息转换系统的概念,证明了最少信息转换系统在合理的等效 - 当大型语言模型遇见个性化:挑战和机遇的视角
大型语言模型在个性化中的应用、挑战和潜在利用方式的讨论。