时间
搜索结果 - 200
- WaterBench:针对大型语言模型的水印综合评估PDF10 months ago
- VerityMath: 自校验实现的数学推理与单位一致性的推动PDF10 months ago
- 寻找长尾:通过逻辑规则引导搜索系统生成长尾知识PDF10 months ago
- MEGAVERSE:跨语言、跨模态、跨模型和跨任务进行大型语言模型基准测试PDF10 months ago
- 前沿语言模型对敌对算术不具鲁棒性,或者说,我需要说些什么,让你同意2+2=5?PDF10 months ago
- ContraDoc:对大型语言模型中文档中的自相矛盾进行理解PDF10 months ago
- HelpSteer: StreamLM的多属性有益数据集PDF10 months ago
- 医生是否了解如何提示?在临床笔记生成中自动优化提示帮助的需求PDF10 months ago
- CARE:从临床文献中提取实验结果PDF10 months ago
- ShareGPT4V:改进大型多模态模型的更好标题PDF10 months ago
- WorldSense:大型语言模型中基于实例推理的合成基准测试PDF10 months ago
- 面向基于提示的NLP模型的模板可转移背门攻击PDF10 months ago
- 评估VLMs用于基于分数的、多探针注释三维物体PDF10 months ago
- 基于人工智能的阿拉伯语填字谜游戏生成用于教育应用PDF9 months ago
- 大型语言模型的检索增强多模态思维链推理PDF9 months ago
- 低限制机制的物理模拟能力PDF9 months ago
- 攻击之树:自动破解黑盒LLMPDF9 months ago
- 估计大型语言模型置信度的方法PDF10 months ago
- 用户友好和适应性强的判别型人工智能:借鉴LLMs和图像生成模型的成功经验PDF9 months ago
- GPT-4在语言语用学中超越人类表现PDF9 months ago