BriefGPT.xyz
大模型
Ask
alpha
关键词
causal self-attention
搜索结果 - 2
通过逐帧离散特征的自监督提取人体动作结构
本文提出了一种编码器 - 解码器模型,用于自我监督方式提取以逐帧离散特征表示的人体动作的结构。
PDF
10 months ago
大规模序列中通过稀疏闪存注意力加速因果注意力
我们扩展了 FlashAttention 以容纳一大类稀疏性注意力模式,其中包括关键 / 查询删除和基于哈希的注意力。即使具有相对较低的稀疏度,我们的方法在序列长度增加时可见地改进 FlashAttention 的性能。不牺牲困惑度的情况下
→
PDF
a year ago
Prev
Next