时间
顶会
搜索结果 - 200
- ACL发挥多重智慧的力量:从 LLM 路由中所学到的经验PDF2 days ago
- RepEval: LLM 表征的有效文本评估PDF3 days ago
- 用多元模型评估 LLM 生成:将法官替换为陪审团PDF4 days ago
- 检查 LLM 评估对基准分布假设的鲁棒性PDF8 days ago
- 研究多轮 LLM 交互的提示泄露效应和黑盒防御PDF9 days ago
- LLM-Personalize: 通过强化自我训练使 LLM 规划器与人类偏好保持一致的家务机器人PDF11 days ago
- 从 LLM 到 NMT:借助 Claude 推动低资源机器翻译的发展PDF11 days ago
- MARIO Eval: 用数学评估你的数学 LLM 工具包PDF11 days ago
- 谁来验证验证者?使 LLM 辅助评估 LLM 输出与人类偏好保持一致PDF15 days ago
- 只用 LLM 来按照用户指令培养文本分类器PDF17 days ago
- FEDSTR:AI 转型之路 - 基于 NOSTR 协议的联合学习与 LLM 培训的去中心化市场PDF18 days ago
- 揭示以度量为重点的 LLM 评估:挑战与解决方案PDF19 days ago
- ACLEIVEN:多模态 LLM 实现高效的隐式属性值提取PDF20 days ago
- 基于代理模型的序列长度预测的高效互动 LLM 服务PDF21 days ago
- 具有 LLM 摘要的拍卖PDF22 days ago
- LLM Agents 能够自主利用一日漏洞PDF22 days ago
- ACL临床记录生成的两种模型设计比较;LLM 是否是一种有用的一致性评估器?PDF24 days ago
- AEGIS: 在线自适应 AI 内容安全审查与 LLM 专家集成PDF24 days ago
- LLM 推理器:大型语言模型逐步推理的新评估、库和分析PDF25 days ago
- 通过 LLM 增强临床效率:心脏患者出院记录生成PDF25 days ago
Prev