AI 论文速递

  • 测试时强化学习(TTRL)
    PDF2 days ago
  • 视频扩散模型的调查:基础、实现与应用
    PDF2 days ago
  • 大语言模型是贪婪代理:RL微调对决策能力的影响
    PDF2 days ago
  • PHYBench:大型语言模型在物理感知与推理中的全面评估
    PDF2 days ago
  • 在推理时使用过程奖励指导 VLM 代理进行 GUI 导航
    PDF2 days ago
  • 描述任何内容:详细的局部图像和视频字幕生成
    PDF2 days ago
  • 一种用于从GDELT重建完整新闻文本的Python工具
    PDF2 days ago
  • 视觉语言模型在简单空间认知中不可靠
    PDF2 days ago
  • 视觉-语言模型在指称表达生成中的实用能力不足
    PDF2 days ago
  • 宝贝,我缩小了语言模型:知识蒸馏方法对性能和可解释性的影响
    PDF2 days ago
  • LongMamba:通过无训练的感受野扩展增强Mamba的长上下文能力
    PDF2 days ago
  • 评估放射学中的视觉语言模型(VLMs):全面分析
    PDF2 days ago
  • 经过认证的最坏情况大型语言模型版权侵犯的缓解
    PDF2 days ago
  • 近似矩阵的最大-最小模糊关系方程组
    PDF2 days ago
  • 缪子优化器加速Grokking现象
    PDF2 days ago
  • 大型语言模型与联邦学习结合实现可扩展和安全的物联网管理
    PDF2 days ago
  • 基准测试大型语言模型用于代码异味检测:OpenAI GPT-4.0 与 DeepSeek-V3
    PDF2 days ago
  • 人工智能超级计算机的发展趋势
    PDF2 days ago
  • 认知流状态的导航:用于有效推理支持的情境感知人工智能干预
    PDF2 days ago
  • AlphaGrad:非线性梯度归一化优化器
    PDF2 days ago
Prev