BriefGPT.xyz
大模型
Ask
alpha
关键词
glue dataset
搜索结果 - 3
IndicSUPERB:印度语言语音处理通用性能基准
该篇论文主要介绍了自然语言理解和语音语言理解中使用的 GLUE 数据集和 SUPERB 基准集,同时提供了 IndicSUPERB 基准集,为印度语音语言理解模型的开发做出贡献。该论文探讨了使用自我监督模型在各种印度语言中进行的训练和评估,
→
PDF
2 years ago
ACL
使用多任务学习还是中间微调进行预训练编码器转移学习的决策
本文研究比较了三种自然语言处理中的迁移学习方法,即 STILTs、MTL 以及 MTL-ALL 的表现。结果显示,MTL-ALL 的性能不如其他两种方法,而在目标任务比较少的情况下,性能较好的是采用 pairwise MTL 方法。
PDF
2 years ago
ACL
预训练语言模型微调中超参数优化的实证研究
本文研究了模型微调和超参数优化的关系,并提出了两种一般策略以及一个实验流程,以系统地解决超参数优化在微调预训练语言模型时的失败案例。通过实验,我们发现在更适当的搜索空间和时间预算设置下,超参数优化可以取得成功,但在某些情况下,过拟合仍然存在
→
PDF
3 years ago
Prev
Next