将生成模型微调作为机器人任务推理方法

Oct, 2023

将生成模型微调作为机器人任务推理方法

Fine-Tuning Generative Models as an Inference Method for Robotic Tasks

Orr Krupnik, Elisei Shafer, Tom Jurgenson, Aviv Tamar

TL;DR通过快速微调模型来适应生成样本与观察证据匹配是一种适用于各种深度生成模型和机器人环境的简单而通用的方法。该方法可应用于自回归模型和变分自动编码器，并在物体形状推断、逆运动学计算和点云完整性方面展现了其可用性。

Abstract

adaptable models could greatly benefit robotic agents operating in the real world, allowing them to deal with novel and varying conditions. While approaches such as Bayesian inference are well-studied frameworks for adapting models to evidence, we build on recent advances in

adaptable models deep generative models neural network models robotic tasks fine-tuning

发现论文，激发创造

决策和控制的深度生成模型

本论文旨在研究深度模型强化学习方法的实证不足，并提出解决方案，同时探讨现代生成建模工具箱中推理技术（包括波束搜索、分类器导向抽样和图像修复等）在强化学习问题中的有效规划策略。

Jun, 2023

永远不止于学习：机器人强化学习中微调的有效性

本论文提出了一种通过强化学习进行增量式 fine-tuning 的方法，可以有效地将图像为基础的机器人操作策略适应到新的环境、物体和感知中，在不到数据学习任务的 0.2％的情况下实现适应，这种方式可以大幅提高任务的性能表现，并且在连续学习场景下仍保持一致稳定。

Apr, 2020

通过任务感知的生成性不确定性实现对于超出分布输入的鲁棒性

本文提出了一种结合生成模型和模型不确定性的不确定性感知机器人感知方法，用于处理源自超出分布状态的不确定性。

Dec, 2018

预训练视觉模型的无损调整在机器人操作中的应用

本文提出 “无损调适” 方案，以解决 fine-tuning 过程对预训练模型通用性的破坏，实验证明此方案在各种任务和模型（ViTs，NFNets 和 ResNets）上表现良好。

Apr, 2023

领域随机化和生成模型在机器人抓取中的应用

通过使用深度学习，机器人抓取技术在数据可用性和算法改进方面取得了显著进展。在本文中，我们探索了一种新的数据生成管道，用于训练深度神经网络执行抓取规划，并提出了一种自回归的抓取规划模型，其将场景的传感器输入映射到可能的抓取概率分布。最终，我们在以前从未见过的物体上实现了 90% 以上成功率。

Oct, 2017

ROSO: 通过合成观测改进机器人政策推断

我们提出使用生成人工智能（AI）来改变推理过程中的观察，以提高预训练策略的零样本性能，并通过稳定的扩散来预处理机器人对新对象的观察，从而在未经漫长微调的情况下提高机器人的适应能力。

Nov, 2023

使用形式方法反馈对语言模型进行微调

使用自然语言任务描述，通过自动合成基于自动机的控制器，并通过与独立提供的规范进行验证，将预训练语言模型完全自动调优以适应自主系统的应用，从而在减少成本的同时弥补了通用知识和特定领域要求之间的差距，其在自主驾驶等多个任务中显示出有效性，使控制器所满足规范的百分比从 60% 提高到 90%。

Oct, 2023

机器人运动生成与调整的导引解码

我们通过集成演示学习（LfD）到运动生成过程中，在复杂环境中（包括障碍物、通过点等）解决了高自由度机械臂的运动生成问题。我们通过在大规模模拟轨迹数据集上训练一个基于条件变分自动编码器变压器的结构，学习了关键的运动生成技能，并将其适应辅助任务和约束条件。我们的自回归方法实现了来自物理系统的实时反馈整合，增强了运动生成的适应性和效率。我们表明，我们的模型可以从初始点和目标点生成运动，同时也能够适应复杂任务的轨迹规划，包括障碍物避让、通过点和速度、加速度限制，在多种平台上实现。

Mar, 2024

muNet: 将预训练的深度神经网络进化为可扩展的自动调整多任务系统

采用预训练深度神经网络层作为基块构建多任务学习系统，通过动态选择相关的先验知识、模型参数和超参数进行自动调优，控制模型规模实现高质量模型与较小的规模之间的权衡，并在 10 个多样化的图像分类任务中，相对于标准调优，提高了平均精度 2.39％而使用了每个任务 47％以上的参数。

May, 2022

快速场景理解：生成模型的参考、推理与重复

提出了一种针对结构化图像模型进行高效推断的框架，可以通过使用循环神经网络执行概率推断实现对场景元素进行有意识的处理，从而在部分特定的 2D 模型（大小可变的变分自动编码器）和完全指定的 3D 模型（概率渲染器）上进行推断而不需要监督学习，从而实现在单次正向神经网络传递中对包括多个对象的 3D 图像进行分解、计数、定位和分类等功能。同时，该文研究还表明，相比较于监督学习，采用该网络结构可以产生更加准确的推断，并且具有良好的泛化能力。

Mar, 2016