- 使用单个训练示例的强化学习在大型语言模型中的推理能力PDFa day ago
- 平衡在线类增量学习中的包容性训练分离和隐式知识交互PDFa day ago
- 在协同进化半监督学习GAN中生成多个子代PDFa day ago
- PRISM:基于投影的奖励整合用于场景感知的少量演示的真实到模拟到真实转移PDFa day ago
- MuRAL:一个使用自然语言标注的多住居民环境传感器数据集,用于日常活动识别PDFa day ago
- 高效令牌注入攻击:通过自适应令牌压缩促使大型语言模型停止推理PDFa day ago
- 群体相对知识蒸馏:学习教师的关系性归纳偏置PDFa day ago
- 数据集转移流的持续因果效应估计PDFa day ago
- 基于强化学习增强的基础模型GUI代理总结PDFa day ago
- TAMO:基于工具辅助的LLM智能体的细粒度根本原因分析与多模态观察数据PDFa day ago
- 通过分层大语言模型提示增强新闻推荐PDFa day ago
- 基于听觉感知的合成语音MOS预测模型(APG-MOS)PDFa day ago
- 在脉冲神经网络知识蒸馏中考虑头尾的KL散度PDFa day ago
- 人工智能心理学研究——首因效应是否影响ChatGPT及其他大型语言模型?PDFa day ago
- GaLore 2:通过梯度低秩投影进行大规模LLM预训练PDFa day ago
- ARCS:带有迭代优化的代理检索增强代码合成PDFa day ago
- RV-Syn:基于结构化函数库的合理且可验证的数学推理数据合成PDFa day ago
- CrashFixer:Linux内核崩溃解决代理PDFa day ago
- 傅里叶谱神经网络:基于傅里叶谱方法的碰撞算子近似以求解玻尔兹曼方程PDFa day ago
- 通过离线仿真和大语言模型进行软件脚本自动化的技能发现PDFa day ago