BriefGPT.xyz
大模型
Ask
alpha
关键词
sequence generation tasks
搜索结果 - 4
大型语言模型中的指导位置在序列生成中的作用
通过改变任务指令在输入句子之后的位置,我们提出了一种增强大型语言模型的指令遵循功能的方法,该方法可以显著改善条件序列生成的零样本性能。
PDF
10 months ago
融合预训练的 ASR 和 LM 进行语音理解的序列生成
我们提出了一个三步走的端到端 SLU 系统,将预训练的语音识别模型和语言模型有效地集成到 SLU 框架中,以用于序列生成任务。该系统在 ASR 和 LM 子网络的基础上进行预测,最终预测基于 ASR 和 LM 子网络的表示结果。我们的三步走
→
PDF
a year ago
EMNLP
句子生成任务中的记忆提取技术
本研究研究了自然语言生成任务中的提取性记忆及其对神经机器翻译的影响,并提出了一种新的算法来生成确切的训练数据以减轻模型中的记忆问题,并通过微调来解决这个问题。
PDF
2 years ago
EMNLP
带有键值记忆的线性变换器
提出了 MemSizer 方法来实现低维度表示和类似于基于核的 Transformer 的增量计算,从而在机器翻译、文本摘要和语言建模等三个应用任务中提高了效率和准确性。
PDF
2 years ago
Prev
Next