EMNLPOct, 2023

ChatGPT 是否是金融专家?对语言模型在金融自然语言处理的评估

TL;DR使用 FinLMEval 框架评估了大型语言模型在金融领域中的能力,并发现虽然一些只有解码器的 LLM 在大多数金融任务中表现出色,尤其是通过零 - shot 提示,但它们在处理专有数据集时通常落后于经过精调的专家模型。该研究为在金融领域构建更高级别的 LLMs 提供了基础评估。