关键词transformer-based large language models
搜索结果 - 31
- 内上下文格式:大型语言模型的快速压缩上下文PDF13 days ago
- 探索 Transformer 潜空间几何对下游任务性能的影响PDF14 days ago
- 循环上下文压缩:高效扩大 LLM 的上下文窗口PDF22 days ago
- 通过分解位置向量探索大型语言模型的上下文窗口PDFa month ago
- HMT:用于长文本语言处理的分层记忆变形器PDF2 months ago
- 高效经济的大型语言模型推理与注意力卸载PDF2 months ago
- 预打包:大语言模型快速预填和增加吞吐量的简单方法PDF3 months ago
- 高效的无限上下问 Transformer 与无限注意力PDF3 months ago
- AAAI插入并玩:一种控制文本生成的提示调整方法PDF3 months ago
- 基于提示 - 提示的专家混合模型进行高效 LLM 生成PDF3 months ago
- DeFT: 带有 IO 感知的快速树注意力的树搜索型 LLM 推理PDF3 months ago
- 语言模型能够模拟求解器吗?使用 LLMs 进行逻辑代码仿真PDF3 months ago
- 非线性变压器的高效上下文学习训练:理论学习和泛化分析PDF4 months ago
- 总结事实:LLMs 中事实回忆的叠加机制PDF5 months ago
- Hydragen:具有共享前缀的高吞吐量 LLM 推理PDF5 months ago
- FlightLLM: 基于 FPGA 的高效大型语言模型推断及其完整映射流程PDF6 months ago
- 其中隐藏真理:使用层选择性排名降低改善语言模型的推理能力PDF6 months ago
- AgentCoder: 基于多智能体的代码生成与迭代测试优化PDF6 months ago
- 通过语义压缩扩展大型语言模型的上下文窗口PDF7 months ago
- Confidant: 基于协作边缘训练的定制 Transformer 语言模型PDF7 months ago
Prev