BriefGPT.xyz
Ask
alpha
关键词
streaming applications
搜索结果 - 4
超长词注意力近似的一遍流式算法在亚线性空间中
部署大型语言模型在涉及长文本的流式应用中面临着内存消耗和时间复杂度的挑战。本文介绍了一种新的算法,通过节约存储空间并保持较低的错误率,在流式应用中高效地处理大型语言模型。
PDF
7 months ago
注意力汇聚的高效流式语言模型
部署大型语言模型(LLMs)在流式应用中的一个研究论文,介绍了两个主要挑战和一个有效的解决方案 StreamingLLM,用于长文本的流式部署,能够在无需微调的情况下实现 LLMs 的稳定和高效的语言建模。
PDF
9 months ago
EMNLP
同时机器翻译的流级延迟评估
本文提出了基于重新划分的流级别延迟评估方法,较好地适用于连续的流翻译,并在参考 IWSLT 任务的流式条件下得到成功评估。
PDF
3 years ago
基于自注意力和增强记忆的流式 Transformer 声学模型
本文提出了一种新颖的增强记忆自注意力机制,用于 Transformer 语音识别中的流式应用,相对于现有的可流式 Transformer 方法,减小了计算量并在 Librispeech 基准测试中实现了超过 15% 的相对误差降低。
PDF
4 years ago
Prev
Next