Jun, 2024

语言模型是否能使用预测策略?

TL;DR深度学习系统在图像分类、基本编程和标准化测试中已经达到或超过了人类的准确率。然而,在预测未来事件的能力上,模型仍然难以取得准确的结果。本研究使用了一种新颖的真实世界事件数据集和相关的人类预测,提出了一个评估指标来衡量预测能力,并对不同基于 LLM 的预测模型在该数据集上的准确性进行了分析。结果显示,模型在预测未来方面仍然存在困难,可能是由于模型倾向于猜测大多数事件不太可能发生,这在许多预测数据集中是正确的,但并不反映实际的预测能力。我们对开发系统化和可靠的 LLM 预测方法的下一步工作进行了思考。