BriefGPT.xyz
Ask
alpha
关键词
illusion or false sense of tom capabilities in llms
搜索结果 - 1
EMNLP
FANToM:机器心智理论在互动中的压力测试基准
FANToM 是一个基准测试,旨在通过问答来在信息非对称的对话环境中对心智理论进行压力测试。我们利用心理学的重要理论要求和评估大型语言模型时的必要实证考虑制定了多种类型的问题,以确定 LLM 中虚假或错误的心智能力。我们证明 FANToM
→
PDF
8 months ago
Prev
Next