AI 论文速递

  • Stackelberg游戏中相关政策的模仿学习
    PDF4 days ago
  • 大型语言模型知道如何丢弃:自注意力引导的键值缓存驱逐以实现高效的长文本推理
    PDF4 days ago
  • 基于离散世界模型的元强化学习在自适应负载均衡中的应用
    PDF4 days ago
  • 有限观察下的零样本动作泛化
    PDF4 days ago
  • ResBench:具有资源意识的LLM生成FPGA设计基准测试
    PDF4 days ago
  • 交叉审查者:评估大型语言模型生成解释的一致性
    PDF4 days ago
  • 鲁棒多目标控制解码的大型语言模型
    PDF4 days ago
  • 结合局部对称性利用与强化学习优化概率推理 -- 进行中的工作
    PDF4 days ago
  • 困惑度陷阱:PLM基础的检索器高估低困惑度文档
    PDF4 days ago
  • CoLMDriver:基于大型语言模型的协作自主驾驶优势
    PDF4 days ago
  • 面向可解释的蛋白质结构预测:稀疏自编码器的应用
    PDF4 days ago
  • 现实环境中的思维链推理并不总是可靠
    PDF4 days ago
  • GarmentCrafter: 逐步新视图合成用于单视图3D服装重建与编辑
    PDF4 days ago
  • AgentOrca:评估语言代理在操作规范和约束遵循方面的双系统框架
    PDF4 days ago
  • REGEN:使用(再)生成解码器学习紧凑的视频嵌入
    PDF4 days ago
  • MEAT:用于人类生成的多视角扩散模型,具有网格注意力机制
    PDF4 days ago
  • 生成机器人宪法与语义安全基准
    PDF4 days ago
  • 探索大型语言模型的词义消歧能力
    PDF4 days ago
  • 利用遵循指令的检索器进行恶意信息检索
    PDF4 days ago
  • 重新思考高维中的扩散模型
    PDF4 days ago