该研究介绍了一种在线环境学习方法,旨在使机器人适应新的社交环境,并采用深度增强学习和在线机器人学习方法来提高机器人社交导航性能。
Jun, 2024
本研究提出了一种上下文活动模型选择算法(CAMS),基于给定策略类的一种新型的不确定性采样查询标准,实现了自适应模型选择任务,相比其他算法可以大幅度降低标记成本,实验证明该算法在多个基准分类数据集上具有效果优异的指标表现。
Jul, 2022
本文提出一种能够在线预测的算法,能够在概率和对抗性设置下与未知复杂度的情境树专家相竞争。通过将结构风险最小化的概率框架纳入现有的自适应算法中,我们不仅可以稳健地学习存在随机结构的同时获得正确的模型阶数,并取得了能够与拥有强侧面信息的最优算法竞争的遗憾边界,从而提供了对模型和随机性同时适应性的第一个具体保证。
May, 2018
这项研究通过评估三类模型在八个数据集上完成了三个不同任务(命名实体识别、政党预测和虚假信息检测)的性能,发现大型语言模型在某些任务上表现出色,开源模型通过微调与封闭源模型相媲美,而监督较小的模型(如 RoBERTa)在许多数据集上能够达到甚至超过生成型模型的性能,但封闭模型在需要最强泛化能力的难任务中仍然保持优势,这强调了模型选择在任务需求中的重要性。
Aug, 2023
在线模型选择是从一组候选模型中‘即时’选择一个模型来对数据流进行预测。本论文提出了一种在线联邦模型选择框架,其中一组学习者与具有足够内存的服务器进行交互,服务器存储所有候选模型。然而,每个学习者只选择将适合其内存的一部分模型存储,并使用其中一个存储的模型执行自己的预测任务。此外,使用该算法,学习者和服务器合作对模型进行微调以使其适应非稳态环境。理论分析证明了该算法相对于后知模型具有次线性损失。对真实数据集的实验表明了该算法的有效性。
Jan, 2024
家用机器人上安装的视觉系统需要与不可见的类别在多变的环境中进行交互。我们提出了 RobOCLe 作为一种少样本在线持续学习模型,通过构建富化特征空间和计算样本的高阶统计矩来改善连续学习模型的鲁棒性。
Jul, 2023
该论文通过在一个在线,不断变化的环境中扩展少样本学习的框架,介绍了一种上下文依赖的新颖学习数据集和一种新的上下文典型记忆模型,旨在缩小人类和机器学习环境之间的差距。
Jul, 2020
本文介绍了一种基于 SSL-ConvSAC 的新方法,该方法结合了半监督学习和强化学习,用于在线抓取学习,并通过上下文课程法解决标记和未标记数据之间的不平衡问题。在真实环境的评估数据上对该方法进行了验证,展示了在物理 7 自由度 Franka Emika 机械臂和吸盘夹具的垃圾箱拾取任务中改善在线抓取学习的潜力。
Mar, 2024
利用联邦学习技术,我们提出一个治理框架以促进开源人工智能模型的共同开发和维护,确保数据隐私和安全,解决开源人工智能软件工程工具在获取组织资源时面临的障碍。我们还提供开发者的指南,包括数据需求、模型架构、更新策略和版本控制,以促进基于人工智能的软件工程工具的合作。此外,我们的研究还探讨了代码数据异质性对联邦学习性能的影响。
Apr, 2024
通过基本理念和关键原则的系统回顾以及对不同算法和技术的适当分类,此调查旨在提供对在线机器学习文献的全面调查。总体而言,现有的在线学习作品可以根据学习类型和反馈信息的形式分为三个主要类别:(i)始终可用全反馈信息的监督式在线学习,(ii)具有有限反馈的在线学习,以及(iii)无反馈可用的无监督在线学习。
Feb, 2018