BriefGPT.xyz
Ask
alpha
关键词
parameter adjustments
搜索结果 - 2
一个令牌可以帮助!学习可扩展和可插拔的虚拟令牌用于增强检索的大型语言模型
通过学习可扩展且可插拔的虚拟标记,我们的方法在保持大型语言模型的原始参数的基础上,仅对这些可插入标记的嵌入进行微调,从而提高了大型语言模型的性能并保留了其普遍的生成能力。
PDF
a month ago
一种具有解释性参数调整的鲁棒分位数 Huber 损失在分布式强化学习中的应用
通过广义分位数 Huber 损失函数从高斯分布之间的 Wasserstein 距离计算出噪声,本文提出了一种广义的分位数 Huber 损失函数,主要用于在分布性强化学习中估计回报分布。与经典分位数 Huber 损失相比,该创新损失函数增强了
→
PDF
6 months ago
Prev
Next