BriefGPT.xyz
大模型
Ask
alpha
关键词
probabilistic confidence bounds
搜索结果 - 1
理解理解:受大型语言模型驱动的实用框架
通过随机采样和应用概率置信边界,我们提出了一个测试任何机器或人类是否理解一门主题的框架,其中包括确定问题范围、要求一般能力和避免荒谬答案,但允许某些问题的错误和 “我不知道” 答案。根据我们的框架,目前的大型语言模型不能说理解非平凡领域,但
→
PDF
18 days ago
Prev
Next