BriefGPT.xyz
Ask
alpha
关键词
taxonomy of human behaviors
搜索结果 - 1
通过交互评估数学语言模型
使用交互式评估方法评估大型语言模型在大学级数学推理方面的能力,为人工智能从业者和数学教授提供可行的建议,重点在于模型应该如何处理不确定性和人类纠错。
PDF
a year ago
Prev
Next