BriefGPT.xyz
Ask
alpha
关键词
priming
搜索结果 - 5
算术变换器中的长度泛化
本文研究 transformers 在基本整数算术和泛化到比训练中出现的更长序列的两个挑战中的应对方法,发现相对位置嵌入能够实现简单任务的长度泛化,但是对于乘法而言失败,提出了训练集引导方法(priming),为训练集添加一些长序列以解决此
→
PDF
a year ago
ACL
印地语词序中的双重机制启动效应
本文使用 Hindi 语料库和适应性神经语言模型,模拟词汇和语言结构的启动作用,并通过对预先构建的语料与人工生成的语料在句子成分上的差异进行逻辑回归分析,发现不同的启动机制独立并互补地作用于动词类别。
PDF
2 years ago
ICML
使用学习者高效微调压缩语言模型
本论文提出使用学习模块和启动技术进行预训练模型的微调,以达到在更短的时间内得到更好效果的目标。实验证明,Learner 模块和 priming 可以在训练速度、资源利用等方面有较大提升。
PDF
2 years ago
一个简单且统一的标记模型,带有引导作用,用于关系结构预测
通过使用 Tagging 模型,对预先训练好的语言模型的输入序列增加预处理,从而提高关联结构提取的精度,并在多语言数据集上进行了广泛的实验及分析,并提出了一种快速且准确的近似方法
PDF
2 years ago
跨语言事件抽取的语言模型预训练
本篇研究提出了一个新颖的、与语言无关的方法来对语言模型进行 “引导”,从而在低资源和零 - shot 跨语言环境中提供特别有效的性能。
PDF
3 years ago
Prev
Next