BriefGPT.xyz
Ask
alpha
关键词
rule-based generalization
搜索结果 - 2
黑雀语言矩阵 (BLM),神经网络规则化通用性的新任务:动机和形式规格
本文提出了一项新任务,即通过模仿人类从复杂数据中提取规则进行类似规则推广的微调任务,以解决当前大型语言模型泛化不足的问题,并提供了相关任务的正式规范和数据生成过程。
PDF
a year ago
Transformers 在存储信息的上下文和权重方面存在不同的泛化能力
本文研究 Transformer 模型的归纳偏差,发现预训练模型在处理稀少类似规则的数据时更倾向于基于规则的归纳,而在无监督学习上表现出基于例子的归纳偏差。
PDF
2 years ago
Prev
Next