BriefGPT.xyz
大模型
Ask
alpha
关键词
end task performance
搜索结果 - 3
探索构建语言特定的 LLM 的设计选择
通过对已有大语言模型进行适应和扩展,我们研究了构建语言专属的大语言模型。我们通过系统实验探究基础模型选择、词汇扩展和持续微调等设计选择对适应后的大语言模型的效率(编码同样数量信息所需的词汇数)和最终任务性能的影响。我们发现,(1)适应前的初
→
PDF
12 days ago
EMNLP
重新思考演示的作用:何为情境学习的关键?
本研究分析显示:大型语言模型不需要准确的演示,而是通过演示提供的标签空间、输入文本的分布和序列的整体格式等方面驱动任务表现的提高。因此,揭示了语境学习的原理和作用方式,同时提出了新的问题,即能否仅仅通过推理来学习大型语言模型的更多内容。
PDF
2 years ago
EMNLP
ALFRED 中的语态调整问题:你是否按照我说的在做?
本文章研究 ALFRED 智能家居环境下的任务完成问题,提出对齐文本和视觉输入是成功的关键,通过提出的度量标准 border adherence score (BAS) 检查现有模型的文本和视觉对齐效果,并提出改进的方法,最终实现了模型对齐
→
PDF
3 years ago
Prev
Next