BriefGPT.xyz
Ask
alpha
关键词
wikibench
搜索结果 - 1
Wikibench: 基于社区驱动的维基百科 AI 评估数据整理
AI 工具越来越多地在社区环境中部署。然而,用于评估 AI 的数据集通常由社区之外的开发者和注释者创建,这可能对 AI 性能产生误导性结论。本研究调查了如何赋予社区推动 AI 评估数据集的有意设计和策划的能力,我们在维基百科进行了探索。我们
→
PDF
5 months ago
Prev
Next