关键词llm capabilities
搜索结果 - 11
- 方言?我几乎不了解她:风格控制与刻板印象的挑战PDF18 days ago
- IPEval: 一种用于大规模语言模型的双语知识产权代理咨询评估基准PDF18 days ago
- ACLHelloFresh: 在 X 社群笔记和维基百科编辑流中对真实世界人类编辑行为的 LLM 评估PDFa month ago
- 可用性解释人工智能:在 LLM 时代利用解释能力的 10 种策略PDF4 months ago
- SciAssess:科学文献分析 LLM 熟练度评估PDF4 months ago
- LLMs 模拟五大人格特质:进一步证据PDF5 months ago
- 当下现状?对多指令语言模型评估的呼吁PDF6 months ago
- 从一本语法书学习翻译新语言的基准PDF9 months ago
- LMSYS-Chat-1M:一种大规模真实 LLM 对话数据集PDF10 months ago
- Struc-Bench:大型语言模型在生成复杂结构化数据方面真的很强吗?PDF10 months ago
- 利用大型语言模型进行自动对话分析PDF10 months ago
Prev
Next