BriefGPT.xyz
Ask
alpha
关键词
synthetic tasks
搜索结果 - 6
S3Eval:一套针对大型语言模型的综合、可扩展、系统评估套件
使用合成任务来评估大型语言模型(LLMs)的研究方法 S3Eval,在 S3Eval 与真实世界基准测试之间存在强相关性,同时揭示了模型性能的一些深度分析和反直觉趋势。
PDF
8 months ago
神经机器翻译的合成预训练任务
本研究旨在探讨何种情况下用合成资源进行预训练是有效的。我们将神经机器翻译作为情景背景,研究使用两种新方法进行翻译模型预训练的影响,并在多种语言对上进行实证评估,结果表明预训练的好处即使在混淆或纯合成数据的情况下也可以实现,并研究混淆和合成预
→
PDF
2 years ago
通过简单的合成任务洞悉预训练
本文研究了预训练对下游任务的影响及其必要性问题,证实使用合成任务进行预训练可以获得较好的效果,并提出了一些简化方案,包括使用 LIME 方法、使用 Set 函数任务和仅使用参数统计信息等。 实验结果表明,这些方案仍能保持较好的性能,且仅使用
→
PDF
2 years ago
ICML
LIME 数学推理基元归纳偏好学习
通过在数据集中编码归纳偏见,我们提出了一种名为 'LIME' 的新型预训练方法,该方法设计了三个综合任务,旨在要求模型具有演绎、归纳和拟合的能力。LIME 任务成本低廉,能够显著优于传统的预训练方法,且只需要典型下游任务计算成本的一小部分。
PDF
3 years ago
EMNLP
低资源领域适应的多阶段预训练
本文研究使用预训练语言模型的转移学习、领域特定术语扩展词汇表以及利用未标记数据结构创造辅助合成任务等方法,在 IT 领域的三个任务中,采用逐步应用的策略在预先训练的 Roberta-large LM 上显示出显着的性能提升。
PDF
4 years ago
ICML
几何矩阵补全:功能观点
我们提出了一种全面功能的几何矩阵完成问题视图,相比现有作品,我们提出了一种新颖的正则化方法,受到功能映射文献的启发,更具可解释性和理论上的可靠性,并在强烈的基础几何结构的合成任务上表现出比现有技术高出数个数量级的潜力,在真实数据集上,我们仅
→
PDF
4 years ago
Prev
Next