AI 论文速递

  • T2Vid:将长文本翻译为多图像是视频大语言模型的催化剂
    PDF4 days ago
  • AlphaTablets:用于从单目视频进行3D平面重建的通用平面表示
    PDF4 days ago
  • DELT:一种简单的基于多样性的早晚训练方法用于数据集蒸馏
    PDF4 days ago
  • 关键令牌的重要性:令牌级对比估计提升大语言模型的推理能力
    PDF4 days ago
  • 自由形式生成提升复杂服装的人体建模
    PDF4 days ago
  • 2024年感知测试:挑战摘要与一种新颖的小时视频问答基准
    PDF4 days ago
  • VLSBench:揭示多模态安全中的视觉泄漏
    PDF4 days ago
  • 面向特定领域的多模态大型语言模型后训练研究
    PDF4 days ago
  • 在未观察到的混杂因素影响下的可扩展的对分布外鲁棒性
    PDF4 days ago
  • 动态脑电图-功能磁共振成像映射:揭示脑连接与认知状态之间的关系
    PDF4 days ago
  • SIMS:用真实世界剧本规划模拟人类与场景的互动
    PDF4 days ago
  • 处理语义网中的不可解决冲突:一种基于RDF的容忍冲突的义务传统方案
    PDF4 days ago
  • 量化航空场景理解中的合成与真实领域差距
    PDF4 days ago
  • 重新审视预测后的推断
    PDF4 days ago
  • 确定性L系统演绎推理问题的经典与量子算法
    PDF4 days ago
  • $C^{3}$-NeRF:通过条件持续神经辐射场建模多个场景
    PDF4 days ago
  • 基于相对冯·诺依曼熵的非交换模型选择用于数据聚类和降维
    PDF4 days ago
  • 高效的量子增强经典仿真用于量子景观的片段
    PDF4 days ago
  • GuardSplat: 高效且强健的三维高斯喷溅水印技术
    PDF4 days ago
  • 非交换模型选择与实同调群的数据驱动估计
    PDF4 days ago
Prev