BriefGPT.xyz
大模型
Ask
alpha
关键词
loki
搜索结果 - 2
Loki: 用于高效稀疏注意力的低秩键
我们提出了一种基于低维空间计算注意力的稀疏注意力方法 Loki,该方法在推理阶段可以更好地保持模型的效力,并通过减少数据移动和计算成本来加快注意力计算。
PDF
a month ago
通过模仿和强化学习实现快速政策学习
本文探讨了一种新的多算法策略,即将多种不同的 RL 和 IL 算法统一到一个 mirror descent 框架下,并提出了名为 LOKI 的基于策略学习的策略,通过 IL 和 RL 的结合可以优于次优专家。
PDF
6 years ago
Prev
Next