目标：通用组合优化智能学习器

Jun, 2024

GOAL: A Generalist Combinatorial Optimization Agent Learner

Darko Drakulic, Sofia Michel, Jean-Marc Andreoli

TL;DRGOAL 是一种通用模型，基于机器学习启发式算法，能够高效地解决多种复杂组合优化问题，并且具有强大的迁移学习能力。

Abstract

machine learning-based heuristics have recently shown impressive performance in solving a variety of hard combinatorial optimization problems (COPs). However they generally rely on a separate neural model, specia

machine learning-based heuristics combinatorial optimization problems generalist model mixed-attention blocks transfer learning capacity

发现论文，激发创造

神经组合优化算法的泛化

本文采用元学习技术来在多种任务中训练一个模型，以优化适应新任务的能力，从而提高两个最先进的模型的泛化能力，实验表明该方法在两个 CO 问题上都有显著改善。

Jun, 2022

通用神经算法学习器

该论文介绍了一种基于图神经网络的通用神经算法学习器，能够学习执行多种算法，如排序、搜索、动态规划、路径查找和几何等，同时提出了一系列改进方法，进一步提高了单任务性能和多任务学习的效果。

Sep, 2022

ML 编译器的可转移图优化器

本文提出了一种基于可扩展序列注意力机制、归纳图神经网络和端到端可转移的深度强化学习方法，用于解决机器学习编译器生成高效机器代码时的图优化问题，并在多个图优化任务中取得显著性能提升。

Oct, 2020

分布式约束优化问题的预训练成本模型

该论文提出了一种基于图神经网络的 DCOPs 解决方案，通过预训练的优化标签数据构建出有效的启发式方法，在分布式环境中实现了去中心化的模型推理，并结合局部搜索或回溯搜索算法，在各种测试中都取得了显著的优异表现。

Dec, 2021

组合优化的多目标指针网络

这项研究提出了一种名为 MOPN 的多目标指针网络单模型深度强化学习框架，用于有效解决多目标组合优化问题，在不同应用场景下深度增强学习与代表性模型、迁移学习等策略相结合下取得了更好的性能。

Apr, 2022

面向决策的图神经网络在组合优化中的应用

我们的研究工作的重点是通过决策导向的图学习，在组合优化问题中采用神经网络框架，提出了一个更高效和精确的框架。此外，我们引入了一个决策导向的框架，利用图神经网络解决具有辅助支持的组合优化问题。实验结果表明，我们的方法在经典组合优化问题上优于独立的图神经网络方法和传统方法。

Jun, 2024

GOPlan: 使用学习模型通过规划进行目标条件下离线强化学习

提出了一种新的基于模型的两阶段框架，Goal-conditioned Offline Planning（GOPlan），通过预训练一个能够捕捉多模式行为分布的先验策略，并利用规划生成假想轨迹进行微调策略，实现了离线多目标操作任务上最先进的性能。

Oct, 2023

图形 Q-Learning 用于组合优化

本论文提出并证明了图神经网络可以应用于解决组合优化问题，通过将优化过程视为顺序决策问题，使用 Q-Learning 训练图神经网络可以在参数和训练时间上只占一小部分的情况下接近达到最先进的启发式求解器的性能。

Jan, 2024

基于图神经网络的组合优化统一框架

基于图神经网络 (GNNs) 的统一框架，解决组合优化问题 (COPs)，包括 COPs 的图表示、非图结构 COPs 转换为图结构 COPs 的等效转换、图分解和图简化，利用 GNNs 有效捕获关系信息和提取 COPs 图表示的特征，为 COPs 提供了通用解决方案，能够解决非图结构和高度复杂图结构的 COPs 限制。

Jun, 2024

MapGo: 面向目标任务的模型辅助策略优化

本文提出了一种名为 FGI 的新的重标记策略用于改善回报稀疏性问题，并通过引入动态模型来生成模拟轨迹来提高采样效率，提出了一种名为 MapGo 框架用于目标导向任务的模型辅助策略优化，并在复杂任务上的实验证明了 FGI 策略相比后见策略的有效性，并且 MapGo 框架相对于无模型的基线表现出更高的采样效率。

May, 2021