- 测试时强化学习(TTRL)PDF2 days ago
- 视频扩散模型的调查:基础、实现与应用PDF2 days ago
- 大语言模型是贪婪代理:RL微调对决策能力的影响PDF2 days ago
- PHYBench:大型语言模型在物理感知与推理中的全面评估PDF2 days ago
- 在推理时使用过程奖励指导 VLM 代理进行 GUI 导航PDF2 days ago
- 描述任何内容:详细的局部图像和视频字幕生成PDF2 days ago
- 一种用于从GDELT重建完整新闻文本的Python工具PDF2 days ago
- 视觉语言模型在简单空间认知中不可靠PDF2 days ago
- 视觉-语言模型在指称表达生成中的实用能力不足PDF2 days ago
- 宝贝,我缩小了语言模型:知识蒸馏方法对性能和可解释性的影响PDF2 days ago
- LongMamba:通过无训练的感受野扩展增强Mamba的长上下文能力PDF2 days ago
- 评估放射学中的视觉语言模型(VLMs):全面分析PDF2 days ago
- 经过认证的最坏情况大型语言模型版权侵犯的缓解PDF2 days ago
- 近似矩阵的最大-最小模糊关系方程组PDF2 days ago
- 缪子优化器加速Grokking现象PDF2 days ago
- 大型语言模型与联邦学习结合实现可扩展和安全的物联网管理PDF2 days ago
- 基准测试大型语言模型用于代码异味检测:OpenAI GPT-4.0 与 DeepSeek-V3PDF2 days ago
- 人工智能超级计算机的发展趋势PDF2 days ago
- 认知流状态的导航:用于有效推理支持的情境感知人工智能干预PDF2 days ago
- AlphaGrad:非线性梯度归一化优化器PDF2 days ago
Prev