关键词reasoning capabilities
搜索结果 - 82
  • 从人工针到真实大量数据集:通过在合成数据上进行微调来改进 LLMs 的检索能力
    PDF5 days ago
  • DEXTER:使用 LLMs 进行开放域复杂问题回答的基准测试
    PDF8 days ago
  • 揭示致命缺陷:评估 LLM 在数学推理中处理错误的能力
    PDF16 days ago
  • 推进工具增强型大型语言模型:整合推断树中错误的见解
    PDF21 days ago
  • 多模态大型语言模型中文本和声音成分的推理研究
    PDF25 days ago
  • MMCLRS - 文本算法推理语言基准测试
    PDFa month ago
  • 如何截断权重提高语言模型中的推理能力
    PDFa month ago
  • 现实中的爱丽丝奇境:显示顶尖大型语言模型完整推理过程的简单任务
    PDFa month ago
  • MindMerger: 非英语语种中高效提升 LLM 推理能力
    PDFa month ago
  • 走向完全声明性神经符号语言
    PDF2 months ago
  • V-FLUTE: 视觉比喻语言理解与文本解释
    PDF2 months ago
  • 链式思维引导的通用验证
    PDF2 months ago
  • 评估大型语言模型的一致性和推理能力
    PDF2 months ago
  • 信息重组改善大型语言模型推理能力
    PDF2 months ago
  • 自主探索避免陷阱:以细粒度奖励提升语言模型的推理能力
    PDF3 months ago
  • ACL当回顾不再是 20/20:大型语言模型反思思维的测试限制
    PDF3 months ago
  • 教育的基础模型:承诺与前景
    PDF3 months ago
  • Ferret-UI: 基于多模态 LLMS 的移动 UI 理解
    PDF3 months ago
  • 超越准确性:评估大型语言模型的推理行为 -- 调查研究
    PDF3 months ago
  • LLMs 能否从以往错误中学习?调查 LLMs 的错误以提升推理能力
    PDF3 months ago
Prev