BriefGPT.xyz
Ask
alpha
关键词
citybench
搜索结果 - 1
CityBench: 评估大型语言模型作为世界模型的能力
在这篇论文中,我们提出了 CityBench 作为第一个用于评估大规模语言模型在城市领域能力的系统性评估基准,通过构建 CitySim 来整合多源数据并模拟细粒度的城市动态,设计了 7 个任务用于评估 LLMs 作为城市规模世界模型在感知理
→
PDF
17 days ago
Prev
Next