关键词autoregressive transformers
搜索结果 - 11
- Sparser 更快且更简洁:用于长程 Transformer 的高效稀疏注意力机制PDF8 days ago
- ROME 的倒台:对 LLMs 在模型编辑中崩溃的理解PDF15 days ago
- CVPR掩蔽自动编解码器是一种有效的多任务视觉通才PDF4 months ago
- ACL机器翻译中的马尔可夫性质再考察PDF5 months ago
- SPOT: 自身训练的基于补丁顺序置换的自回归 Transformer 的物体中心学习PDF7 months ago
- 大型语言模型隐式学习将神经句子轨迹纠正为自然语言的预测性表示PDF8 months ago
- 面向高效和可解释的自回归转换器的动态上下文剪枝PDFa year ago
- MEGABYTE: 使用多尺度 Transformer 预测百万字节序列PDFa year ago
- 通过缩放实现更好的语音合成PDFa year ago
- 基于自回归变换器的文本驱动矢量图标合成PDFa year ago
- RITA:扩展生成蛋白质序列模型的研究PDF2 years ago
Prev
Next