- 连续测试时间适应中源知识的有效恢复
通过无监督领域变化检测方法,该论文解决了传统测试时适应方法在动态环境中适应连续变化的目标分布时所面临的挑战,包括之前学习的有价值源知识的灾难性遗忘和由于错误标签的错误校准而导致的渐进性误差积累问题。
- DICE: 用于轨迹预测的多样化扩散模型与评分
在动态环境中,道路用户轨迹预测是一个具有挑战性但十分关键的任务,特别适用于自动驾驶等各种应用。本研究提出了一种新的框架,以计算高效的方式利用扩散模型来预测未来的轨迹。我们展示了该方法在常见的行人和自动驾驶基准数据集上取得了最先进的性能。
- 学习分布式希伯阶相邻表征
这篇论文介绍了一种针对不稳定、部分可观测环境下决策的在线隐藏表示学习方法。提出的分布式赫比时态记忆(DHTM)算法基于因子图形式和多组分神经元模型,它旨在捕捉序列数据关系,并对未来观察作出累积预测,形成继承者表示。经实验证明,DHTM 算法 - 3DS-SLAM:基于三维物体检测的动态室内语义 SLAM
3DS-SLAM 是一种针对动态场景的 3D 语义建图算法,通过 3D 物体检测和动态特征过滤等方法,解决了动态环境下相机定位的精度问题。与其他四个主流动态场景 SLAM 系统相比,3DS-SLAM 在 TUM RGB-D 数据集的动态序列 - AI 代理的记忆和泛化能力分析:连续学习者是否稳健?
提出了一种新颖的连续学习(CL)框架,通过使用有限容量的内存保存先前观察到的环境信息以减轻遗忘问题,并从内存中采样数据点来估计环境变化的风险分布,从而获得对未知变化具有鲁棒性的预测器。实验表明,该算法在所有环境中优于基于内存的 CL 基线, - 结合启发式和多智体强化学习的多机器人路径规划
提出了一种结合启发式搜索、经验法则和多智能体强化学习的路径规划方法 MAPPOHR,将启发式搜索用于生成全局路径,用经验法则和奖励函数激励实时规划器,用多智能体强化学习算法实现实时规划,实验证明该方法比传统学习和启发式方法的规划性能更好且学 - 动态语料库上的持续更新生成式检索
本研究介绍了一个名为 STREAMINGIR 的新基准,用于评估检索方法对于动态变化语料库(如实时问答)的泛化能力,并比较了双编码器和生成式检索的性能和效率。结果表明,生成式检索在不同程度的监督下表现出不同的性能,但是参数高效的措施可以在某 - 在线非随机模型无关强化学习
该研究探讨了针对动态或敌对环境的强化学习算法,并引入基于干扰信号的新型政策以提高适应性和鲁棒性,并在标准 RL 基准测试中进行了评估并证明了改进的鲁棒性。
- 利用 GRADE 生成的合成数据进行学习
提出了用于机器人研究的可定制的、真实动态环境生成框架 (GRADE),利用该框架生成数据集用于检测和分割人物,并表明使用该数据集进行预训练能够提高模型性能
- 早期分类多模态序列
本次试验展示了将现有方法综合运用到多模态序列的早期分类问题中可获得高达 8.7% 的实验性 AUC 优势。
- 异常检测的终身学习:新挑战、新视角和新洞见
本文探讨了如何构建面向终身异常检测的基础,提出了终身学习面临的挑战和机遇,明确了终身异常检测的重要性,并提出了一种情景生成方法以进行实验
- 合作多智能体系统中动态 DCOP 的分布式交互图构建
提出了一种新的分布式交互图构建算法,用于解决在开放和动态环境下 DCOP 算法中交互图的生成和维护问题,并通过实验测试表明,该算法有效地构建和维护稳定的多智能体交互图。
- 使用 GNN 和时间编码进行基于学习的动态环境运动规划
本文介绍了一种基于 GNN 的方法,利用时间编码和模仿学习与数据聚合来学习嵌入和边缘优先策略,以显着加速在线规划。
- 基于梯度的 B 样条轨迹优化的视觉辅助无人机导航及动态避障
该论文提出了一种基于梯度的 B 样条轨迹优化算法,利用机器人的视觉感知,可以在动态环境中快速、安全地生成避障轨迹。
- 具备历史信息和交互的多子目标机器人在人群中导航
本文提出了一种基于深度强化学习的多子目标机器人导航方法,采用图神经网络对所有机器人和人类的历史信息进行编码与交互,以提高机器人的预测未来场景的能力,并引入选择模块来减少不可靠位置点的出现,实验结果表明该方法在拥挤的人类环境中能够更好地满足任 - HTN 规划和行动的任务修改器
该研究提出了一种基于任务修改器的层级任务网络规划扩展,以实现在动态环境中对代理进行意外事件响应的能力。通过在两个环境中评估性能,证明了该方法的有效性。
- 学习推理和行动物理级联事件
介绍了一个称为 “Cascade” 的新型监督学习框架,使用基于事件的前向模型和语义树搜索算法来教会 AI 在复杂的动态环境中进行干预,并推动级联式事件触发达到特定的 “反事实” 目标,从而有效地遵循指令。
- 朝向自学习的端到端任务导向对话系统
本文研究了如何通过自学习的方式使得 Task Bots 自适应于动态环境,并提出了 SL-AGENT 框架,该框架包含一个对话模型和一个预训练的奖励模型,能够在无需或最小化人工标注的情况下通过强化学习在人机交互中学习,并在自动和人工评估中证 - ACL在动态环境中维护共同基础
本研究提出了一个新颖的任务设定,以研究在动态环境下创建和维护共同基础的能力,通过新的数据集和实验,探讨了该设定引入的挑战和基线对话系统的能力,并讨论了未来的研究前景。
- 面向动态环境的实时 RGB-D 语义 SLAM
本文提出了一种基于实时语义 RGB-D SLAM 算法的方法,其能够在动态环境中检测已知和未知的运动物体,并通过仅对关键帧进行语义分割来减少计算成本,并保持静态地图以实现强健的相机跟踪,同时提出了一种有效的几何模块来检测未知的移动物体。该算