关键词language modeling
搜索结果 - 355
  • xLSTM:扩展的长短期记忆
    PDF2 months ago
  • 无需种植树木的语法学习:理解变换器何时以及何种方式实现分层普遍化
    PDF2 months ago
  • 超越查询:通过强化学习训练更小的语言模型进行网络交互
    PDF2 months ago
  • ACL语言的更多空间:探究检索对语言模型的影响
    PDF2 months ago
  • ACL通过多指令训练教授一种多语言的大型语言模型理解多语言语音
    PDF2 months ago
  • 文本的双模态:视觉和文本生成预训练
    PDF2 months ago
  • 压缩线性地表现智能
    PDF2 months ago
  • 关于 LLMs 中的分词理论
    PDF3 months ago
  • HGRN2:具有状态扩展的门控线性循环神经网络
    PDF3 months ago
  • 小型语言模型性能下降的原因:通过 Softmax Engular 点探究语言模型饱和现象
    PDF3 months ago
  • Transformer 可解释性转移到 RNN 中吗?
    PDF3 months ago
  • AdamW 的隐式偏差: l∞范数约束优化
    PDF3 months ago
  • Edisum: 大规模概述和解释维基百科编辑
    PDF3 months ago
  • RALL-E: 强大的编解码器语言建模与思维链刺激在文本合成中的应用
    PDF3 months ago
  • 语言模型是否对未来的标记进行计划?
    PDF3 months ago
  • COLING一种新的大规模多语言数据集用于高性能语言技术
    PDF3 months ago
  • 拆解标记化:评估文本压缩及其与模型性能的相关性
    PDF4 months ago
  • 重尾类不平衡问题及 Adam 在语言模型上的优越性
    PDF4 months ago
  • 通过更稀疏的选择提高稀疏模型的效率
    PDF4 months ago
  • GlórIA - 一种面向葡萄牙语的生成式和开放性大型语言模型
    PDF4 months ago