你在意什么？致力于机器人学习的视觉表征对齐

Oct, 2023

你在意什么？致力于机器人学习的视觉表征对齐

What Matters to You? Towards Visual Representation Alignment for Robot Learning

Ran Tian, Chenfeng Xu, Masayoshi Tomizuka, Jitendra Malik, Andrea Bajcsy

TL;DR通过人类反馈，提出了一种用于解决视觉表征对齐问题和视觉奖励学习问题的方法：表示对齐的基于偏好的学习（RAPL）。在X-MAGICAL和机器人操纵的实验中，RAPL的奖励 consistently 生成高样本效率的优选机器人行为，并在视觉表征来自与机器人不同的实体的情况下显示出强大的零样本泛化能力。

Abstract

When operating in service of people, robots need to optimize rewards aligned with end-user preferences. Since robots will rely on raw perc

发现论文，激发创造

表征至关重要: 提高机器人感知和探索能力

本文在三个机器人任务中系统评估了多种常见的学习和手工工程化表示方法，并从三个方面对每种表现方法进行评估，即维度，可观测性和分离度，发现在输入代理或作为辅助任务的情况下，可以显著提高性能，并挑战了什么是控制机器人'好'表示的见解。

Nov, 2020

将机器人的表示与人类对齐

研究了如何将在一个环境中学到的知识传递到另一个环境中的关键问题，并通过学习人类期望机器人执行哪些任务的中间表示方法，来提高机器人学习效率，从而为人类与机器人的互动打下基础。

May, 2022

VIP：通过价值内隐预训练实现通用视觉奖励和表示

本研究提出了一种称为VIP的表示自学习方法，通过自监督目标条件强化学习的方式从未标注的人类视频中生成稠密的，可平滑的奖励函数，克服机器人数据获取上的困难，并在实验中表现出优异的表现。

Sep, 2022

SIRL：基于相似性的隐式表示学习

从人们定义的相似度中学习表示使机器人能够识别和隔离人们实际关心和使用的因果特征，从而更好地学习他们的喜好和目标。在模拟和用户研究中，我们证明通过这种相似度查询学习可以比自我监督和任务输入等传统的表示学习方法得到更具有一般性的表示。

Jan, 2023

机器人和人类表示的对齐

本文调查了当前大部分奖励和模仿学习方法的机器人任务表示与人类任务表示不匹配的问题，并主张应该将机器人学习任务的表示与人类对齐，以及从定义问题的数学角度出发研究机器人物理表示学习。

Feb, 2023

语言驱动的机器人表示学习

本文介绍了一种基于语言驱动的视觉表示学习方法，即Voltron，并通过全面的实验验证表明其在五种不同的机器人学习问题上的表现优于以往技术，特别是在需要更高级特征的问题上。

Feb, 2023

面向人类的机器人操作的表示学习

人类具有内在的通用视觉表征，使其能够高效地探索和与环境进行物体操控。本研究提出使用多任务微调的方式在经过预训练的视觉编码器上学习感知技能，通过任务融合解码器指导表示学习，使得对于所有感知技能来说，学习编码的结构能够更好地表示重要信息，最终为下游的机器人操控任务提供帮助。大量实验验证了任务融合解码器在多个机器人任务和仿真及现实环境中对于三种最先进的视觉编码器（R3M、MVP和EgoVLP）的表示进行了改进，提升了下游操控策略的学习性能。

Oct, 2023

DecisionNCE: 通过隐式偏好学习实现的具身多模态表示

通过多模态预训练方法，本论文提出了一种通用的统一目标，可以同时从图像序列中提取有意义的任务进展信息，并将其与语言指令无缝对齐，以提供一种优雅地提取本地和全局任务进展特征的实体化表示学习框架，通过隐式时间对比学习强制执行时间一致性，并通过多模态联合编码确保轨迹级指令定位，从而为统一的表示和奖励学习提供了多样化的解决方案。

Feb, 2024

机器人预训练机器人：基于大规模机器人数据集的操作中心化机器人表示

本研究解决了机器人学习中缺乏大规模领域内数据集的问题。我们提出了一种名为操作中心化表示（MCR）的框架，通过结合视觉特征和任务动态信息，显著提高了机器人操作任务的成功率。实验证明，MCR在模拟和现实任务中的性能提高超过14%和76%，展示了其在高效学习中的潜在影响。

Oct, 2024

机器人预训练机器人：基于大规模机器人数据集的操作中心机器人表示

本研究解决了机器人学习中缺乏大规模领域特定数据集的问题。提出了一种新的操作中心表示（MCR）框架，通过捕捉操作任务的视觉特征和动态信息来提高表现，实验证明MCR在多个模拟领域的任务中表现超越基线方法14.8%，并在现实世界任务中提升性能76.9%。

Oct, 2024