关键词long sequences
搜索结果 - 27
  • 长序列处理中的状态空间建模:对 Transformer 时代中的循环的调查
    PDF21 days ago
  • ICML短 - 长卷积有助于高效硬件线性注意力集中于长序列
    PDF22 days ago
  • Megalodon: 高效的 LLM 预训练与无限上下文长度的推断
    PDF3 months ago
  • BurstAttention: 极长序列的高效分布式注意力框架
    PDF4 months ago
  • InfLLM: 揭示 LLM 对于无需训练的记忆理解极长序列的内在能力
    PDF5 months ago
  • ICLRAutoChunk: 自动激活块用于高效存储长序列推理
    PDF5 months ago
  • LongBoX:评估基于 Transformer 的长序列临床任务
    PDF8 months ago
  • M4LE: 一个适用于大型语言模型的多能力多范围多任务多领域长上下文评估基准
    PDF8 months ago
  • 快速多极注意力:一种长序列的分而治之注意机制
    PDF9 months ago
  • DON-LSTM:多分辨率学习中的 DeepONets 和长短时记忆神经网络
    PDF9 months ago
  • 近无限背景下的分块 Transformer 环形注意力
    PDF9 months ago
  • BASS: 语音摘要的分块调整
    PDFa year ago
  • 用于长上下文大模型的分块并行 Transformer
    PDFa year ago
  • HiPool:基于图神经网络对长文档建模
    PDFa year ago
  • CVPRToken Turing 机
    PDF2 years ago
  • 基于稀疏注意力记忆网络的长序列点击率预测
    PDF2 years ago
  • ACL利用短文本模型高效理解长文本
    PDF2 years ago
  • FlashAttention: 带 IO 感知的快速、节省内存的精确注意力机制
    PDF2 years ago
  • ACL直接语言翻译中注意力的局部性
    PDF2 years ago
  • 分层 Transformer 是更高效的语言模型
    PDF3 years ago
Prev