将生成模型微调作为机器人任务推理方法
本论文旨在研究深度模型强化学习方法的实证不足,并提出解决方案,同时探讨现代生成建模工具箱中推理技术(包括波束搜索、分类器导向抽样和图像修复等)在强化学习问题中的有效规划策略。
Jun, 2023
本论文提出了一种通过强化学习进行增量式 fine-tuning 的方法,可以有效地将图像为基础的机器人操作策略适应到新的环境、物体和感知中,在不到数据学习任务的 0.2%的情况下实现适应,这种方式可以大幅提高任务的性能表现,并且在连续学习场景下仍保持一致稳定。
Apr, 2020
本文提出 “无损调适” 方案,以解决 fine-tuning 过程对预训练模型通用性的破坏,实验证明此方案在各种任务和模型(ViTs,NFNets 和 ResNets)上表现良好。
Apr, 2023
通过使用深度学习,机器人抓取技术在数据可用性和算法改进方面取得了显著进展。在本文中,我们探索了一种新的数据生成管道,用于训练深度神经网络执行抓取规划,并提出了一种自回归的抓取规划模型,其将场景的传感器输入映射到可能的抓取概率分布。最终,我们在以前从未见过的物体上实现了 90% 以上成功率。
Oct, 2017
我们提出使用生成人工智能(AI)来改变推理过程中的观察,以提高预训练策略的零样本性能,并通过稳定的扩散来预处理机器人对新对象的观察,从而在未经漫长微调的情况下提高机器人的适应能力。
Nov, 2023
使用自然语言任务描述,通过自动合成基于自动机的控制器,并通过与独立提供的规范进行验证,将预训练语言模型完全自动调优以适应自主系统的应用,从而在减少成本的同时弥补了通用知识和特定领域要求之间的差距,其在自主驾驶等多个任务中显示出有效性,使控制器所满足规范的百分比从 60% 提高到 90%。
Oct, 2023
我们通过集成演示学习(LfD)到运动生成过程中,在复杂环境中(包括障碍物、通过点等)解决了高自由度机械臂的运动生成问题。我们通过在大规模模拟轨迹数据集上训练一个基于条件变分自动编码器变压器的结构,学习了关键的运动生成技能,并将其适应辅助任务和约束条件。我们的自回归方法实现了来自物理系统的实时反馈整合,增强了运动生成的适应性和效率。我们表明,我们的模型可以从初始点和目标点生成运动,同时也能够适应复杂任务的轨迹规划,包括障碍物避让、通过点和速度、加速度限制,在多种平台上实现。
Mar, 2024
采用预训练深度神经网络层作为基块构建多任务学习系统,通过动态选择相关的先验知识、模型参数和超参数进行自动调优,控制模型规模实现高质量模型与较小的规模之间的权衡,并在 10 个多样化的图像分类任务中,相对于标准调优,提高了平均精度 2.39%而使用了每个任务 47% 以上的参数。
May, 2022
提出了一种针对结构化图像模型进行高效推断的框架,可以通过使用循环神经网络执行概率推断实现对场景元素进行有意识的处理,从而在部分特定的 2D 模型(大小可变的变分自动编码器)和完全指定的 3D 模型(概率渲染器)上进行推断而不需要监督学习,从而实现在单次正向神经网络传递中对包括多个对象的 3D 图像进行分解、计数、定位和分类等功能。同时,该文研究还表明,相比较于监督学习,采用该网络结构可以产生更加准确的推断,并且具有良好的泛化能力。
Mar, 2016