关键词model size
搜索结果 - 105
  • LLM 鲁棒性能的扩展趋势探究
    PDF2 days ago
  • u-$μ$P: 单位缩放的最大更新参数化
    PDF3 days ago
  • 模型规模对数据到文本生成中精调语言模型性能的影响:最新研究
    PDF8 days ago
  • 迭代自我完善中的自发奖励突破
    PDF22 days ago
  • 52B 到 1T:通过远程 FLM 系列学到的经验教训
    PDF24 days ago
  • 认知不确定性的漏洞:贝叶斯神经网络的问题
    PDF25 days ago
  • ICML大规模语言模型中的自我认知:一项探索性研究
    PDFa month ago
  • 面向多语言大语言模型的平行语料利用方法
    PDFa month ago
  • 模型大小对在线连续学习中灾难性遗忘的影响
    PDFa month ago
  • 解决语言模型计算最优扩展的差异
    PDFa month ago
  • ICML语言模型中心理状态表征的基准测试
    PDFa month ago
  • Uni-Mol2:规模化探索分子预训练模型
    PDFa month ago
  • 大语言模型中政治劝导的对数标度定律的证据
    PDFa month ago
  • LLM 的文化价值差异:提示、语言和模型尺寸
    PDFa month ago
  • 线性回归中的缩放定律:计算、参数和数据
    PDFa month ago
  • BitsFusion:扩散模型的 1.99 位权重量化
    PDF2 months ago
  • 大型语言模型记忆机制的多角度分析
    PDF2 months ago
  • PolygloToxicityPrompts: 大型语言模型中神经毒性退化的多语种评估
    PDF2 months ago
  • ICLR模型大小对通过 LIME 解释 LLM 的影响
    PDF3 months ago
  • 基于梯度的神经网络芯片上每权重混合精度量化
    PDF3 months ago
Prev