应对不完美对称性：一种新的对称学习演员 - 评论扩展

Sep, 2023

应对不完美对称性：一种新的对称学习演员 - 评论扩展

Addressing Imperfect Symmetry: a Novel Symmetry-Learning Actor-Critic Extension

Miguel Abreu, Luis Paulo Reis, Nuno Lau

TL;DR通过自适应对称学习（ASL）模型，该研究旨在通过强化学习捕捉人类大脑适应不完全或不精确对称任务的能力，并在各种情境中通过减小波动来提高性能。

Abstract

symmetry, a fundamental concept to understand our environment, often oversimplifies reality from a mathematical perspective. Humans are a prime example, deviating from perfect symmetry in terms of appearance and

symmetry reinforcement learning adaptive symmetry learning model-minimization actor-critic perturbations

发现论文，激发创造

学习任务对称机器人策略的对称性考虑

通过数据增强和镜像损失函数的两种方法，将对称不变性纳入深度强化学习中，可在各种具有挑战性的机器人任务中实现更快收敛和改进的学习行为。

Mar, 2024

强化学习中的函数逼近对称性学习

研究如何利用对称性以实现强化学习的样本效率，引入检测对称性的新方法，并证明其完整性；提供了将发现的对称性用于功能逼近的框架，并证明基于潜在效益的奖励塑形对于利用对称性特别有效；实验表明，利用对称性信息可以显著提高学习性能。

Jun, 2017

利用动力学中的对称性进行有偏向奖励的基于模型的强化学习

通过 Cartan 的运动参考系方法，我们提出了一种学习动力学模型的技术，该模型具有指定的对称性，并通过数值实验证明所提出的方法可以学习出更准确的动力学模型。

Mar, 2024

面向对称性的三维分子设计的演员 - 评论家算法

使用深度强化学习自动化分子设计，在利用基于图形表示法设计分子的进步存在基本限制的情况下，我们提出了一种新的三维分子设计策略，该策略通过基于球谐级数展开的旋转协变的状态 - 动作表示法利用了设计过程的对称性，进而产生了先前方法无法实现的分子结构，并通过几个 3D 分子设计任务展示了这种策略的优越性。

Nov, 2020

${m E}(3)$-Equivariant Actor-Critic 合作多智能体强化学习方法

本文重点研究了自然界中对称模式的识别和分析，在物理学中导致了引力定律的制定和化学结构研究的进展。我们着眼于利用某些协同多智能体强化学习问题中固有的欧几里得对称性，该问题在许多应用中普遍存在。我们首先形式化地表征了一类具有对称最优值和策略存在性的马尔科夫博弈的子类。在这些属性的基础上，我们设计了具有对称约束的神经网络架构，作为多智能体演员 - 评论家方法的归纳偏见。这种归纳偏见在各种协同多智能体强化学习基准测试中表现出优越的性能，以及在具有重复对称模式的未见场景中进行的零样本学习和迁移学习等令人印象深刻的泛化能力。代码可在此 https URL 获取。

Aug, 2023

基于图像的机器人学习的非对称演员 - 评论家算法

本研究使用深度强化学习的 actor-critic 算法，利用物理模拟器的完全状态可观测性，针对机器人操作中的部分观测（RGBD 图像）的问题进行训练，通过使用不对称输入来显著提高性能，并使用领域随机化的方法，实现了在没有真实世界数据的情况下，在真实机器人上进行的模拟到真实世界的转移。

Oct, 2017

从对称性学习：具有对称数据和语言指示的元强化学习

提出了一种双 MDP 元强化学习方法，该方法将语言指令和对称数据结合到元 RL 中，能够显著提高元强化学习的泛化能力和学习效率。

Sep, 2022

机器学习中实施、发现和促进对称性的统一框架

提供了将对称性引入机器学习模型的一种统一的理论和方法框架，包括强制已知对称性、发现未知对称性和通过施加凸正则化函数来促进对称性等方面。

Nov, 2023

学习对称和低能量行走

该论文提出了一种新颖的基于深度强化学习（DRL）方法来训练机器人的步态控制算法，并引入了一种新的课程学习方法来提供适当的物理辅助，帮助机器人保持平衡和前进。

Jan, 2018

物体中心的深度主动推理模型中的对称性与复杂性

本篇论文探讨了使用主动推理方法中生成模型的潜在空间中如何出现特定物体的内在对称性，重点关注物体中心表示法，并借助主成分分析技术展示了模型在潜在空间中编码了物体主对称轴，最后指出更对称表示法的利用有助于操作任务的更好泛化。

Apr, 2023