BriefGPT.xyz
Ask
alpha
关键词
convre benchmark
搜索结果 - 1
EMNLP
LLM 在理解逆关系上的无效性研究
大型语言模型在形式化语言任务中取得了显著的成功,但目前的基准主要遵循 LLM 的预训练数据分布。本文探讨了 LLM 在一种特殊情况下的结构语义理解能力问题,提出了 ConvRe 基准,通过多项选择问答任务评估 LLM 确定关系和相关文本匹配
→
PDF
9 months ago
Prev
Next