时间
搜索结果 - 200
  • WaterBench:针对大型语言模型的水印综合评估
    PDF10 months ago
  • VerityMath: 自校验实现的数学推理与单位一致性的推动
    PDF10 months ago
  • 寻找长尾:通过逻辑规则引导搜索系统生成长尾知识
    PDF10 months ago
  • MEGAVERSE:跨语言、跨模态、跨模型和跨任务进行大型语言模型基准测试
    PDF10 months ago
  • 前沿语言模型对敌对算术不具鲁棒性,或者说,我需要说些什么,让你同意2+2=5?
    PDF10 months ago
  • ContraDoc:对大型语言模型中文档中的自相矛盾进行理解
    PDF10 months ago
  • HelpSteer: StreamLM的多属性有益数据集
    PDF10 months ago
  • 医生是否了解如何提示?在临床笔记生成中自动优化提示帮助的需求
    PDF10 months ago
  • CARE:从临床文献中提取实验结果
    PDF10 months ago
  • ShareGPT4V:改进大型多模态模型的更好标题
    PDF10 months ago
  • WorldSense:大型语言模型中基于实例推理的合成基准测试
    PDF10 months ago
  • 面向基于提示的NLP模型的模板可转移背门攻击
    PDF10 months ago
  • 评估VLMs用于基于分数的、多探针注释三维物体
    PDF10 months ago
  • 基于人工智能的阿拉伯语填字谜游戏生成用于教育应用
    PDF9 months ago
  • 大型语言模型的检索增强多模态思维链推理
    PDF9 months ago
  • 低限制机制的物理模拟能力
    PDF9 months ago
  • 攻击之树:自动破解黑盒LLM
    PDF9 months ago
  • 估计大型语言模型置信度的方法
    PDF10 months ago
  • 用户友好和适应性强的判别型人工智能:借鉴LLMs和图像生成模型的成功经验
    PDF9 months ago
  • GPT-4在语言语用学中超越人类表现
    PDF9 months ago