COLINGMar, 2024

大型语言模型的日本金融基准构建

TL;DR本研究通过构建多个特定于日本和金融领域的任务基准和测量,确认 GPT-4 模型在所有性能范围内表现优异,并验证了该基准评估方法的有效性。