BriefGPT.xyz
Ask
alpha
关键词
deft
搜索结果 - 3
DeFT: 带有 IO 感知的快速树注意力的树搜索型 LLM 推理
通过树搜索解码,DeFT 提出了一种基于 IO 的树注意力算法,实现了内存高效的注意力计算,加速了端到端推理任务的运行速度。
PDF
3 months ago
DEFT: 灵巧微调用于现实世界手部策略
通过 DEFT(DExterous Fine-Tuning for Hand Policies)方法,结合软体机器手、基于人类驱动的经验和在线优化过程,本文探索了灵活性和复杂操作任务,并取得了成功的实验结果,展示了通向全面灵巧操作的数据高效
→
PDF
8 months ago
DEFT: 利用模型层之间的梯度范数差异实现可扩展梯度稀疏化
梯度稀疏化是减少分布式深度学习中过多通信流量的广泛采用解决方案,然而,大多数现有的梯度稀疏化方法由于梯度选择的计算成本较高和 / 或由于梯度累积导致的通信流量增加而具有相对较差的可扩展性。为了解决这些挑战,我们提出了一种新颖的梯度稀疏化方案
→
PDF
a year ago
Prev
Next