关键词model size
搜索结果 - 85
  • 大型语言模型是否学习类似人类的战略偏好?
    PDF10 days ago
  • 基于神经自回归模型的高效实时钢琴转录
    PDF11 days ago
  • 潜在扩散模型的缩放特性:更大不一定更好
    PDF20 days ago
  • 微型图神经网络用于无线资源管理
    PDF24 days ago
  • 人工智能与内存壁
    PDFa month ago
  • 大规模语言模型在提示注入攻击下的机器翻译伸缩行为
    PDFa month ago
  • 揭开缩放法则之迷:第一部分
    PDFa month ago
  • 基于大型语言模型中的文本、概率和隐藏状态的记忆洞察
    PDF2 months ago
  • 大型语言模型中的连续预训练探索:洞见与影响
    PDF2 months ago
  • 串联思维不忠诚的伪装准确性
    PDF2 months ago
  • PaCKD: 模式聚类知识蒸馏用于压缩内存访问预测模型
    PDF2 months ago
  • 揭示语言模型嵌入中的潜在人类福祉
    PDF2 months ago
  • 自我反馈的危险:自我偏见在大型语言模型中增强
    PDF2 months ago
  • ClusterTabNet:用于表格检测和表格结构识别的有监督聚类方法
    PDF2 months ago
  • ACL频率解释了大型语言模型的大小、训练数据量和意外性与阅读时间的逆相关关系
    PDF3 months ago
  • 构建推荐系统中的大规模基数处理
    PDF3 months ago
  • OCR 的标度律实证研究
    PDF4 months ago
  • PanGu-$π$: 通过非线性补偿提高语言模型架构
    PDF4 months ago
  • SlimmeRF:精简射线场
    PDF4 months ago
  • 动态训练和可定制推断的弹性神经网络
    PDF5 months ago
Prev