Oct, 2023
FollowBench:用于大型语言模型的多级细粒度约束追踪基准
FollowBench: A Multi-level Fine-grained Constraints Following Benchmark for Large Language Models
Yuxin Jiang, Yufei Wang, Xingshan Zeng, Wanjun Zhong, Liangyou Li...
TL;DR本文提出了 FollowBench,这是一个用于大型语言模型(LLMs)的多级细粒度约束遵循基准,通过评估 LLMs 在遵循不同类型的细粒度约束方面的表现,揭示了 LLMs 在遵循指令方面的不足之处,并指出了未来研究的潜在方向。