BriefGPT.xyz
Ask
alpha
关键词
scaling trends
搜索结果 - 2
EMNLP
LLM 在理解逆关系上的无效性研究
大型语言模型在形式化语言任务中取得了显著的成功,但目前的基准主要遵循 LLM 的预训练数据分布。本文探讨了 LLM 在一种特殊情况下的结构语义理解能力问题,提出了 ConvRe 基准,通过多项选择问答任务评估 LLM 确定关系和相关文本匹配
→
PDF
9 months ago
在竞争环境下,改进的贝叶斯风险可能导致社会福利的减少
本研究分析了在多家模型提供商竞争市场环境下,机器学习模型的规模对预测准确度的影响,并发现在某些情况下,即使提高数据表示质量可以减少贝叶斯风险,但整体而言也会导致跨用户的总体预测准确性下降。
PDF
a year ago
Prev
Next