Feb, 2024

AnaloBench: 评估抽象与长文本上下文类比的鉴别能力

TL;DR用于评估语言模型中类比推理能力的基准模型 ANALOBENCH 可以从大量信息中回忆相关经验,并将类比推理应用于复杂和冗长的情景中。