BriefGPT.xyz
Ask
alpha
关键词
training paradigms
搜索结果 - 4
大型语言模型的可解释性概述
对大型语言模型的解释技术进行分类和总结,并讨论了这些技术在训练范式、生成局部解释和全局解释方面的应用以及评估指标、调试模型和提高性能的挑战和机会。
PDF
10 months ago
语言模型概述:最新发展与展望
本文从语言单位、结构、训练方法、评估方法和应用等五个方面,介绍了传统语言模型和预训练语言模型,讨论了二者的关系和语言模型在预训练时代的未来发展方向。
PDF
a year ago
使用视频和图像联合训练 Transformer 提高动作识别
本文探索视频 transformer 的几个训练范式,并提出了一种称为 CoVeR 的方法,通过与图像的共同训练,提高了视频 transformer 的性能,尤其是在动作识别上,取得了最好的结果。
PDF
3 years ago
MOOC 学生退学预测的深度挖掘
本研究分析了自动化 MOOC 退课预测器的准确性估计,并比较了标准的退课预测架构在四种不同的训练范式下的准确性,结果表明,在真实情境中,“事后” 训练和测试可能会高估准确度,而基于学生持续性的代理标签训练的退学分类器也能与基于事后训练的预测
→
PDF
7 years ago
Prev
Next