- T2Vid:将长文本翻译为多图像是视频大语言模型的催化剂PDF4 days ago
- AlphaTablets:用于从单目视频进行3D平面重建的通用平面表示PDF4 days ago
- DELT:一种简单的基于多样性的早晚训练方法用于数据集蒸馏PDF4 days ago
- 关键令牌的重要性:令牌级对比估计提升大语言模型的推理能力PDF4 days ago
- 自由形式生成提升复杂服装的人体建模PDF4 days ago
- 2024年感知测试:挑战摘要与一种新颖的小时视频问答基准PDF4 days ago
- VLSBench:揭示多模态安全中的视觉泄漏PDF4 days ago
- 面向特定领域的多模态大型语言模型后训练研究PDF4 days ago
- 在未观察到的混杂因素影响下的可扩展的对分布外鲁棒性PDF4 days ago
- 动态脑电图-功能磁共振成像映射:揭示脑连接与认知状态之间的关系PDF4 days ago
- SIMS:用真实世界剧本规划模拟人类与场景的互动PDF4 days ago
- 处理语义网中的不可解决冲突:一种基于RDF的容忍冲突的义务传统方案PDF4 days ago
- 量化航空场景理解中的合成与真实领域差距PDF4 days ago
- 重新审视预测后的推断PDF4 days ago
- 确定性L系统演绎推理问题的经典与量子算法PDF4 days ago
- $C^{3}$-NeRF:通过条件持续神经辐射场建模多个场景PDF4 days ago
- 基于相对冯·诺依曼熵的非交换模型选择用于数据聚类和降维PDF4 days ago
- 高效的量子增强经典仿真用于量子景观的片段PDF4 days ago
- GuardSplat: 高效且强健的三维高斯喷溅水印技术PDF4 days ago
- 非交换模型选择与实同调群的数据驱动估计PDF4 days ago
Prev