Mar, 2024

PARMESAN:无参数的内存搜索与密集预测任务转导

TL;DR通过转导推理的方式解决深度学习中的灵活性问题,提出了 PARMESAN(无参数记忆搜索和转导),一种可扩展的转导方法,通过修改记忆内容实现无需连续训练或微调可学参数的学习,与常用的神经架构兼容,并在连续学习和少样本学习等任务中展现了较快的学习速度和高预测性能。