关键词pretrain-finetuning paradigm
搜索结果 - 2
- 离线元强化学习的上下文变换器
本文探讨了如何通过 prompt tuning 和 Contextual Meta Transformer 算法来提高基于序列建模的离线强化学习算法的性能,并在三种不同的离线 RL 设置下进行了广泛的实验,验证了方法的高效性和普适性。
- 通过图形拓扑导出的最优运输优化微调图神经网络
本研究提出了一种基于最优传输的微调框架,称为图拓扑诱导的最优传输微调(GTOT-Tuning),用于增强在图学习上预训练模型微调的表示保存性,并证明它在各种图神经网络模型上比现有技术表现更好。