关键词n-tom benchmarks
搜索结果 - 1
  • OpenToM: 评估大型语言模型理解他人心理思维能力的全面基准
    PDF5 months ago
Prev
Next