BriefGPT.xyz
Ask
alpha
关键词
urban domain
搜索结果 - 2
CityBench: 评估大型语言模型作为世界模型的能力
在这篇论文中,我们提出了 CityBench 作为第一个用于评估大规模语言模型在城市领域能力的系统性评估基准,通过构建 CitySim 来整合多源数据并模拟细粒度的城市动态,设计了 7 个任务用于评估 LLMs 作为城市规模世界模型在感知理
→
PDF
16 days ago
SURE-Val: 安全的城市相关性扩展与验证
通过采用现有方法扩展到城市领域,本研究定义感知数据集中的相关对象,并提供了一种基于运动预测组件的新的相关性验证方法,通过考虑大规模数据集中的预测性能的统计分布来量化对预测的影响,成功地验证了所提出的相关性标准的有效性。
PDF
a year ago
Prev
Next