BriefGPT.xyz
Ask
alpha
关键词
sampling temperature
搜索结果 - 3
采样温度对大型语言模型的问题解决效果的影响
通过对大型语言模型的不同采样温度进行实证研究,发现采样温度在 0.0 至 1.0 范围内对于解决问题的性能没有统计学上显著的影响。
PDF
5 months ago
利用验证器提高预训练语言模型的规划能力
本论文通过使用 GPT-2 实验来证明,预训练的大型语言模型在计划方面的表现较差,研究人员首先建立了一个验证器在特定状态下对行动的适用性进行分类,然后在生成器中随机抽样无效动作来训练验证器,在生成器和验证器的共同作用下,取得了不错的成果。
PDF
a year ago
多语言翻译干扰的原因和解决方法
本文介绍了多语言机器翻译中干扰现象的主要因素,以及如何通过控制模型大小、数据大小和采样温度来减轻干扰并提升性能。
PDF
2 years ago
Prev
Next