BriefGPT.xyz
大模型
Ask
alpha
关键词
llms' performance
搜索结果 - 2
基于错误人工评估的 GPT-4 在句子简化中的深入评估
通过设计错误基础的人类注释框架来评估 GPT-4 在句子简化方面的能力,进一步深入了解大型语言模型的性能,同时确保评估的可靠性。该研究发现 GPT-4 相对于现有最先进的模型来说,普遍生成较少错误的简化输出,但在词汇转述方面仍然存在限制。此
→
PDF
4 months ago
逐步了解演示的递增效用:针对少样本上下文学习重排的分析
该文研究了大型语言模型在上下文学习中的效应,探讨了不同的标签策略对目标任务结果的影响,并提出了一种新颖的标签方法 —— 增量效用,实验证明该方法有效地提升了大型语言模型的性能。
PDF
8 months ago
Prev
Next