时间
顶会
搜索结果 - 200
  • ACL发挥多重智慧的力量:从 LLM 路由中所学到的经验
    PDF2 days ago
  • RepEval: LLM 表征的有效文本评估
    PDF3 days ago
  • 用多元模型评估 LLM 生成:将法官替换为陪审团
    PDF4 days ago
  • 检查 LLM 评估对基准分布假设的鲁棒性
    PDF8 days ago
  • 研究多轮 LLM 交互的提示泄露效应和黑盒防御
    PDF9 days ago
  • LLM-Personalize: 通过强化自我训练使 LLM 规划器与人类偏好保持一致的家务机器人
    PDF11 days ago
  • 从 LLM 到 NMT:借助 Claude 推动低资源机器翻译的发展
    PDF11 days ago
  • MARIO Eval: 用数学评估你的数学 LLM 工具包
    PDF11 days ago
  • 谁来验证验证者?使 LLM 辅助评估 LLM 输出与人类偏好保持一致
    PDF15 days ago
  • 只用 LLM 来按照用户指令培养文本分类器
    PDF17 days ago
  • FEDSTR:AI 转型之路 - 基于 NOSTR 协议的联合学习与 LLM 培训的去中心化市场
    PDF18 days ago
  • 揭示以度量为重点的 LLM 评估:挑战与解决方案
    PDF19 days ago
  • ACLEIVEN:多模态 LLM 实现高效的隐式属性值提取
    PDF20 days ago
  • 基于代理模型的序列长度预测的高效互动 LLM 服务
    PDF21 days ago
  • 具有 LLM 摘要的拍卖
    PDF22 days ago
  • LLM Agents 能够自主利用一日漏洞
    PDF22 days ago
  • ACL临床记录生成的两种模型设计比较;LLM 是否是一种有用的一致性评估器?
    PDF24 days ago
  • AEGIS: 在线自适应 AI 内容安全审查与 LLM 专家集成
    PDF24 days ago
  • LLM 推理器:大型语言模型逐步推理的新评估、库和分析
    PDF25 days ago
  • 通过 LLM 增强临床效率:心脏患者出院记录生成
    PDF25 days ago
Prev