本文介绍了一种使用 Meta-critic 方法的 Actor-Critic 强化学习算法,可以显著加速学习过程并构建具有高效采样的离线学习框架,通过实验证明了 Meta-critic 方法与离线学习 Off-PAC 算法(包括 DDPG、TD3 和 SAC)相结合,在连续控制环境中取得了显著的性能提升。
Mar, 2020
针对强化学习中仍存在的新场景快速泛化的问题,该研究提出了一个元学习算法,通过对反梯度策略学习的评论家进行元学习来优化学习任务通用的代理。结果表明,该算法可以学习到接近真实 Q 值函数的评论家,使学到的评论家能够适应于新的任务和环境,并能用于学习新策略。
Apr, 2022
提出了一种基于强化学习和元学习的框架来解决 few-shot learning 问题,通过稳定的损失函数来学习最佳的优化算法,从而实现了对参数的更新。实验结果表明该方法在准确率和 NDCG 指标上均超过了现有的替代方法,并且可扩展到网络结构搜索。
May, 2020
本文提出了一种模型无关的元学习算法,通过少量的训练样本,使用梯度下降算法来训练模型的参数,实现了对新学习任务的快速调整和学习,导致在少量图像分类、回归和神经网络政策优化方面表现出最先进的性能。
Mar, 2017
本研究致力于发展一种在少量标记数据情况下对未标记数据进行分类的方法并提出一种新型 Prototypical Networks 和一种使用未标记数据的元学习算法来解实际问题,经过对 Omniglot、miniImageNet 和 ImageNet 进行实验,验证了这些算法可以使预测结果得到显著改进。
Mar, 2018
本文介绍了一种新的元学习方法 Meta Networks(MetaNet),它通过快速参数化学习跨任务的元级知识,并在新概念上进行快速泛化,同时保持了以前所学的性能表现,在 Omniglot 和 Mini-ImageNet 基准测试中,我们的 MetaNet 模型实现了接近人类水平的表现,并在准确性上优于基线方法高达 6%。我们展示了 MetaNet 的几个有吸引力的性质,如泛化和持续学习。
该论文提出了一种信息论的元学习模型,通过优化划分学习任务,使得专业的决策者解决子问题,从而达到高效的适应新任务的效果,在图像分类、回归和强化学习三个元学习领域进行验证。
Oct, 2019
使用 meta-recognition 模型通过 autoencoder 方法,学习简洁的模型代码,并通过 meta-generative 模型构建任务特定模型参数,实现比 fine-tuned 基线网络更低的损失和与最先进的元学习算法相匹配的性能,同时还能够识别对模型预测有影响的训练样本和预测获取哪些附加数据将对改善模型预测最有价值。
Jul, 2018
该论文介绍了元学习在深度学习中的应用及其近期发展,涵盖度量、记忆、基于学习等方法,并探讨了当前的挑战和未来的研究方向。
Mar, 2023
该论文回顾了元学习的概念和应用,其与深度学习的不同之处在于其能够适应于少量高维数据集,可以用于模型自适应,可不断自我完善实现高度自主的人工智能。元学习不断发展创新,不同的发展方法已有不同的应用和研究方向,进一步拓展了机器学习的应用领域。
Apr, 2020