关键词llm capabilities
搜索结果 - 11
  • 方言?我几乎不了解她:风格控制与刻板印象的挑战
    PDF18 days ago
  • IPEval: 一种用于大规模语言模型的双语知识产权代理咨询评估基准
    PDF18 days ago
  • ACLHelloFresh: 在 X 社群笔记和维基百科编辑流中对真实世界人类编辑行为的 LLM 评估
    PDFa month ago
  • 可用性解释人工智能:在 LLM 时代利用解释能力的 10 种策略
    PDF4 months ago
  • SciAssess:科学文献分析 LLM 熟练度评估
    PDF4 months ago
  • LLMs 模拟五大人格特质:进一步证据
    PDF5 months ago
  • 当下现状?对多指令语言模型评估的呼吁
    PDF6 months ago
  • 从一本语法书学习翻译新语言的基准
    PDF9 months ago
  • LMSYS-Chat-1M:一种大规模真实 LLM 对话数据集
    PDF10 months ago
  • Struc-Bench:大型语言模型在生成复杂结构化数据方面真的很强吗?
    PDF10 months ago
  • 利用大型语言模型进行自动对话分析
    PDF10 months ago
Prev
Next