关键词scaling
搜索结果 - 83
  • 高效扩展的 LLMs
    PDF2 days ago
  • ICLR超越均匀缩放:探索神经结构中的深度异质性
    PDF5 days ago
  • 对手塑形的样本复杂度分析
    PDF16 days ago
  • 通过反向传播优化密度泛函理论降低量子化学数据成本
    PDF18 days ago
  • EVA-GAN: 提升各种音频生成的可扩展生成对抗网络
    PDF24 days ago
  • 通过可扩展的分词技术灵活扩展大型语言模型的上下文
    PDFa month ago
  • 点变换器 V3:更简单、更快、更强
    PDF2 months ago
  • 金字塔神经辐射场 PyNeRF
    PDF3 months ago
  • PaSS:并行推测采样
    PDF3 months ago
  • Transformer 神经网络架构中注意力机制的缩放点积的替代方法
    PDF3 months ago
  • 面向能适应非结构化数据的无模型强化学习算法的发展
    PDF4 months ago
  • MetisFL: 一个可扩展且高效的联邦学习工作流程尴尬并行化控制器
    PDF4 months ago
  • 语言感知中的缩放和指示调整角色:模型与人类注意力之比较
    PDF4 months ago
  • Monarch Mixer:一个简单的次线性 GEMM 架构
    PDF4 months ago
  • VeRA:基于向量的随机矩阵适应
    PDF4 months ago
  • 学生数学错误逐步纠正
    PDF4 months ago
  • EMNLP将专家合并为一体:提高混合专家的计算效率
    PDF4 months ago
  • LEMON: 无损模型扩展
    PDF4 months ago
  • 洪水与回响:用分布式计算对 GNNS 进行算法调整
    PDF4 months ago
  • Colmap-PCD:一个用于图像与点云精细配准的开源工具
    PDF5 months ago
Prev