- 增强模仿学习策略的在线适应性
我们提出通过在线调整来弥补模仿学习中的失败,我们的方法将预训练策略的动作建议与专家记录的相关经验相结合,通过适应的行为更好地模仿专家策略,实验表明适应的智能体表现比纯模仿学习的对应体更好,特别是在基础策略灾难性失败时,适应的智能体仍然能够实 - 基于源自由的在线领域自适应卫星图像语义分割在图像退化下的应用
在线自适应卫星图像分割中的分布偏移问题是一个关键但尚未充分探索的问题。本文提出了一种新的在线测试时领域适应方法,通过两种有效策略来缓解由各种形式的图像退化引起的分布偏移。通过全局 BN 统计估计和全局类别中心修正预测掩码的方法,我们的方法在 - 主动学习引导的联邦在线适应:在医学图像分割中的应用
我们提出了一种名为 DrFRODA 的计算机友好、隐私保护的医学图像分割技术,利用联邦学习以在线方式适应模型,并通过医生的反馈进行改进。我们在公开可用数据集上的实验结果表明,所提出的基于分布式主动学习的在线适应方法优于无监督的在线适应方法, - 非线性动态系统的自适应元学习基于 KKL 观测器设计
通过元学习,我们介绍了一种基于测量数据对系统输出进行信息提取的方法,设计了一种能够适应不同系统条件和属性的学习型 Kazantzis-Kravaris/Luenberger 观测器,实现了高精度的非线性系统状态估计,并具备较强的泛化能力和噪 - 结构光系统中用于动态场景的在线自适应视差估计
深度神经网络在单目结构光系统中的密集视差估计方面取得了显著进展,但在未知环境中应用时性能显著下降。为了解决这个问题,提出了自监督在线适应作为解决方案来弥合这种性能差距。本文提出了一种基于长序列输入的无监督损失函数,确保更好的梯度方向和更快的 - 自采样元 SAM:用元学习增强少样本医学图像分割
通过自抽样元 SAM(SSM-SAM)框架,本研究提出了一种快速在线适应的医学图像分割方法,通过设计三个关键模块,包括在线快速梯度下降优化器、自抽样模块和针对医学少样本学习的强大的基于注意力的解码器,能够在医学图像分割的少样本任务中显著提高 - SATA: 源锚定和目标对齐网络用于连续测试时间自适应
本文提出一种基于在线自适应的新框架 SATA,它可以无缝地适应不同的批处理大小,同时通过使用源锚定的自蒸馏来修改批归一化的仿射参数,来确保模型具有不遗忘以前经历的领域知识的能力。同时,提出基于源原型驱动的对比对齐方法,以确保目标样本的自然分 - 在线偏好中的积极奖励学习
为了实现机器人在不同环境和人类偏好中的适应性,本研究提出了在线稀疏二元偏好查询的方法,通过设计查询和决定何时呈现查询来最大化查询结果的信息价值,从而使得机器人能够快速适应实际应用场景并减轻人类专家的负担,在模拟,人类用户研究和真实机器人实验 - CVPR在线无监督域自适应的行人再识别
本文提出了一个可行的在线适应和隐私保护的无监督领域适应方法,使用知名的 Market-1501,Duke 和 MSMT17 基准测试对最新的 UDA 算法进行了适应和评估。
- 面向在线领域自适应目标检测
本研究提出了一种适用于目标检测的新型统一自适应框架,可以在线适应和改进目标领域的泛化能力,并使用 MemXformer 作为记忆模块和对比损失来增强目标特定的表示学习。
- ICLRPAnDR: 通过解耦策略和环境表示从离线经验中快速适应新环境
本文介绍了一种离线训练和在线适应设置下的策略快速适应方案 PAnDR,其通过对比学习和策略恢复学习环境表示和策略表示,在线适应阶段通过梯度上升算法优化策略,在几个典型问题上的实验结果表明,PAnDR 算法可优于现有算法。
- CVPR基于递归最小二乘估计法的在线学习在视觉跟踪中的应用
本文提出了一个无需离线训练的在线学习方法,通过递归最小二乘算法辅助进行 few-shot 在线自适应学习,实现在模型中构建记忆保留机制,同时防止过度拟合和遗忘,有效提升了现代深度跟踪器的表现效率。
- AAAI改进的扩展卡尔曼滤波器用于神经网络模型的在线自适应,用于可定制和可转移驾驶行为预测
本文针对自动驾驶车辆中人的驾驶行为的随机性,异质性和时变性构成的挑战,将 $ au$ 步的改进的扩展卡尔曼滤波参数适应算法应用于驾驶行为预测任务,使用观察到的轨迹给出反馈,并通过对基于神经网络的模型进行改进,提出了一套新的度量标准来系统评估 - 基于动态双层在线适应的跨领域人体网格重建
该研究考虑如何在线适应人体网格重建模型以适应不同相机参数、骨长、背景和遮挡等因素产生的分布偏移,提出 Dynamic Bilevel Online Adaptation 算法,并在三项人体网格重建基准测试中取得最先进的结果。
- MMAuxAdapt: 稳定高效的测试时间适应方法,用于保持视频语义分割的时序一致性
该论文提出了一种无监督在线适应方法,名为 AuxAdapt,用于提高神经网络模型的时域一致性,通过利用一个辅助分割网络(AuxNet)对原始的分割网络(Main-Net)的决策进行针对性的修改,实现对视频序列的快速、准确、稳定的训练。
- CVPR面向开放世界的泛化:在线适应深度视觉里程计
本研究提出了一种基于场景不可知几何计算和贝叶斯推理的在线适应深度视觉里程计的框架,该方法采用了自监督学习,解决了深度学习视觉里程计训练数据和测试数据之间的域差异,通过光流和深度等信息实现姿态估计,具有良好的通用性和自适应性。
- 在线适应的人类模型分析
本研究模拟机器人学习算法为动态系统,控制为机器人观察到的人类数据,利用可达性分析和最优控制解决机器人在线学习参数的安全问题,并在自主驾驶和室内导航等四个领域展示了其实用性。
- 使用精简强化的模型进行 Tracker 追踪
本文提出了一种新的视觉目标跟踪模型,通过知识蒸馏和强化学习训练了一个紧凑的学生模型,可以从其他跟踪器中传输和压缩跟踪知识,并利用在线学习的评估措施,建立一个快速、简单且有效的跟踪机制使得最终跟踪器与实时最先进的跟踪器具有相同的竞争力。
- AAAI基于注意力的在线自适应说话人身份识别方法
本文提出了一种基于注意力机制的在线自适应方法,以处理视频分析领域的说话人识别任务,实现对新数据的模型更新,减少模型设置时间,并在多项评估指标中比较了该方法与现有梯度方法的性能优劣,进一步验证了该方法的有效性。
- MM将其上线:将场景坐标回归网络预测应用于在线 RGB-D 相机重定位
本研究提出了一种新的方法来利用在一个场景中训练的神经网络来预测另一个场景中的点,以实现相机在线定位,并在 7-Scenes 和 Cambridge Landmarks 数据集上实现了最先进的性能,运行时间低于 300 毫秒。