BriefGPT.xyz
Ask
alpha
关键词
bichat
搜索结果 - 1
BIBench:大型语言模型的数据分析知识基准测试
为了评估大型语言模型(LLMs)在商业情报领域中数据分析能力方面的表现,研究引入了 BIBench,一种全面的基准测试。BIBench 评估 LLMs 在商业情报基础知识、知识应用和技术技能三个维度上的能力,并且包含 11 个子任务。另外,
→
PDF
6 months ago
Prev
Next