BriefGPT.xyz
Ask
alpha
关键词
glue benchmark tasks
搜索结果 - 2
KDD
知识注入的自注意力变换器
本论文旨在提出一种有系统的方法将外部知识图谱融入 Transformer 模型中,以解决在语言模型中存在的幻觉和对人类用户生成无用和不安全输出的问题,并在 GLUE 基准测试任务上进行大量实验证明其有效性。
PDF
a year ago
大型预训练语言模型微调的多目标优化方法:监督对比学习
将 SCL 问题描述为 RoBERTa 语言模型精调阶段的多目标优化问题,使用线性标量化方法和精确 Pareto 最优解法解决优化问题,在多个 GLUE 基准任务上,无需使用数据增强、存储器库或生成对抗性示例,找到了比竞争对比学习基线更好的
→
PDF
2 years ago
Prev
Next