BriefGPT.xyz
Ask
alpha
关键词
prediction head
搜索结果 - 4
ACL
Transformer 语言模型处理预测头中的词频
本研究调查了预测头的内部工作,特别关注偏差参数,并发现 BERT 和 GPT-2 模型中的预测头偏差对模型反映语料库中的词频有重要作用,可通过对偏差的控制在实践自回归文本生成场景下生成更多样化的文本。
PDF
a year ago
通过图段训练学习大型图的属性预测
该研究提出了一种名为 Graph Segment Training (GST) 的框架,它通过历史嵌入表获取大型图形的嵌入,实现了基于分段策略的预测学习方法,从而提高了效率和准确性。
PDF
a year ago
MM
无对比自监督学习中预测头机制
本文介绍了一种自监督学习方法,其中相称损失中的负项可以通过添加 prediction head 被消除,理论上和实验上证明了这种方法能够避免维度崩溃现象,并且通过正常的梯度下降可以学习有效表示来替代只学习强特征的偏见。
PDF
2 years ago
盲目图像质量评估的持续学习
本研究提出了一种针对 BLQA 的基于连续学习的模型,以提高模型的适应性和稳定性,通过新的预测头和正则化器来实现在不断增长的数据流中不断学习并避免灾难性遗忘,在所有预测头的估计的自适应加权求和得出最终图像质量评分。
PDF
3 years ago
Prev
Next