May, 2024
超区间:用超网络方法训练连续学习中的权重区间
HyperInterval: Hypernetwork approach to training weight interval regions in continual learning
Patryk Krukowski, Anna Bielawska, Kamil Książek, Paweł Wawrzyński, Paweł Batorski...
TL;DR通过嵌入空间内的区间算术和超网络将连续学习中的遗忘问题纳入控制范围,HyperInterval 模型在多项基准测试中获得显著优于 InterContiNet 的结果,并能够训练出一个适用于所有任务的统一网络。