比较微调和元学习在少样本策略模仿中的有效性

Jun, 2023

比较微调和元学习在少样本策略模仿中的有效性

Comparing the Efficacy of Fine-Tuning and Meta-Learning for Few-Shot Policy Imitation

Massimiliano Patacchiola, Mingfei Sun, Katja Hofmann, Richard E. Turner

TL;DR本文探索了用于控制问题的少样本模仿学习，在只访问少数离线结果的情况下学习模仿目标策略的方法，并验证了针对控制问题 fine-tuning 的有效性，提出了一种用于少样本学习的基线，将在一个基础环境上在线训练，然后在目标策略的少量离线结果中进行微调。

Abstract

In this paper we explore few-shot imitation learning for control problems, which involves learning to imitate a target policy by accessing a limited set of offline rollouts. This setting has been relatively under

few-shot imitation learning meta-learning fine-tuning control problems reinforcement learning

发现论文，激发创造

部分优于全部：重温少样本学习的微调策略

本文提出了一种针对 few-shot learning 中使用的分类器训练，通过在基础模型中冻结或微调特定层以转移部分知识来提高性能，并引入基于进化搜索的方法以自动化此选择过程，以得到在 CUB 和 mini-ImageNet 中具有最先进表现的该方法。

Feb, 2021

元调整的跨域少样本学习

通过引入迁移学习和元学习以及改进的训练过程包括一阶 MAML 算法和图神经网络模型，本文提出的方法在加上数据增强后，在新的跨领域少样本学习基准上实现了 73.78% 的平均准确度，比既有基准提高了 6.51%。

May, 2020

微调与元强化学习的有效性比较

本文研究使用 meta - 强化学习方法来完成多个视觉基准测试，在评估这些方法时，我们发现在不同的任务上，多任务预训练加微调的性能相当甚至更好，这与使用 meta-pretraining 和 meta test-time adaptation 的表现相当。因此我们建议在未来的 meta-RL 中加入更具挑战性的任务以及多任务预训练和微调作为更简单，强大的基线。

Jun, 2022

重新审视调整微调策略以用于少样本学习

该研究证明，在 mini-ImageNet 数据集中，fine-tuning 方法在 1-shot 任务中比常见的 few-shot learning 算法具有更高的准确性，在 5-shot 任务中准确率几乎与最先进的算法相同，同时展示了在高分辨率单领域和跨领域任务中，该方法比常见 few-shot learning 算法具有更高的准确性。

Oct, 2019

一次性模仿学习

本文旨在提出一个元学习框架，称之为一次学习，实现机器人从极少量的演示中学习，并即刻推广到相似的其他任务中。

Mar, 2017

永远不止于学习：机器人强化学习中微调的有效性

本论文提出了一种通过强化学习进行增量式 fine-tuning 的方法，可以有效地将图像为基础的机器人操作策略适应到新的环境、物体和感知中，在不到数据学习任务的 0.2％的情况下实现适应，这种方式可以大幅提高任务的性能表现，并且在连续学习场景下仍保持一致稳定。

Apr, 2020

元调节损失函数和数据增强用于少样本目标检测

本研究旨在提出一种新的训练机制，从元学习的角度调整损失函数和数据增强的动态，以实现在少量样本下精准检测物体的目标，实验结果显示，在 Pascal VOC 和 MS-COCO 数据集上，该方法相较于基于 fine-tuning 和元学习的现有模型都取得了显著的进展。

Apr, 2023

少样本图像分类的基准线

这篇研究论文旨在通过优化跨熵损失训练深度网络，提出一种基准模型来解决 few-shot 学习问题，并通过使用更多的元训练类来提高准确性，同时提出衡量 few-shot 任务难度的度量标准。

Sep, 2019

基于元 Dropout 的统一框架用于小样本学习

本研究提出了一种基于元学习框架的元学习 Few-Shot Learning 方法，其中利用一种简单而有效的元 Dropout 机制，防止神经元在元训练阶段过度协同。实验验证了该方法在目标检测领域的有效性。

Oct, 2022

分子少样本学习是否真的需要元训练？

我们重新审视了更简单的精调方法，基于马氏距离提出了一种正则化的二次探针损失，设计了一种专用的块坐标下降优化器，达到了与现有方法相媲美的竞争性能，并且适用于黑盒设置，消除了特定的情节预训练策略的需求。此外，我们引入了一个新的基准来评估竞争方法对领域变化的健壮性，在这个设置下，我们的精调基准模型始终获得比元学习方法更好的结果。

Apr, 2024