AI 论文速递

  • 从分类器视角研究无分类器引导
    PDFa day ago
  • 一种令人沮丧却极其有效的攻击基准:对GPT-4.5/4o/o1强大的黑箱模型成功率超过90%
    PDFa day ago
  • 行动中的不确定性:具身智能体的信心引导
    PDFa day ago
  • 科技视界:揭示大型多模态模型在多模态科学问题上的知识理解与视觉推理
    PDFa day ago
  • 无数据模仿学习:利用预训练视频扩散模型
    PDFa day ago
  • LHM:基于单张图像的快速可动画人类重建模型
    PDFa day ago
  • ETCH:通过等变紧致性对穿衣人类进行体形拟合的泛化
    PDFa day ago
  • 无归一化的变换器
    PDFa day ago
  • 围攻:利用树搜索对大型语言模型进行自主多轮破解
    PDFa day ago
  • 适应性大型语言模型的组合子空间表示微调
    PDFa day ago
  • 动态特征融合的双阶段跨模态网络用于情感模仿强度估计
    PDFa day ago
  • TruthPrInt:通过潜在真实引导预干预缓解大型视觉语言模型的对象幻觉
    PDFa day ago
  • 浅层神经网络学习的谱偏差是由非线性选择所塑造的
    PDFa day ago
  • VisualWebInstruct:通过网络搜索扩大多模态指令数据的规模
    PDFa day ago
  • KUDA:关键点统一动态学习与视觉提示的开放词汇机器人操控
    PDFa day ago
  • 语言模型、图搜索与监督污染:何时更多的监督反而更少,以及如何使更多的监督变得更有效
    PDFa day ago
  • 粒状球支持向量回归
    PDFa day ago
  • 项目编写缺陷对项目反应理论中的难度和区分度的影响
    PDFa day ago
  • 视频情感分析的轻量级模型
    PDFa day ago
  • PiSA:一种自增强的数据引擎和大型模型的训练策略用于三维理解
    PDFa day ago
Prev