BriefGPT.xyz
Ask
alpha
关键词
cuda tensors
搜索结果 - 1
标签循环:转录器的高效解码
该论文介绍了一种高效的贪婪解码算法,用于转导推断,通过使用 CUDA 张量表示批量中的部分假设来支持并行化的假设操作,在解码过程中,我们的算法通过采用嵌套循环设计最大化 GPU 并行性,其中内循环处理所有空白预测,而非空白预测在外循环中处理
→
PDF
a month ago
Prev
Next