BriefGPT.xyz
大模型
Ask
alpha
关键词
decoder-only architecture
搜索结果 - 4
ACL
仅解码流式变换器用于同声传译
在这篇论文中,我们介绍了一种名为 Decoder-only Streaming Transformer (DST) 的 Decoder-only SiMT 模型,该模型通过编码源前缀和目标前缀的位置来确保目标前缀的位置不受源前缀扩展的影响,
→
PDF
a month ago
基于 Transformer 的语言模型内部工作原理初探
这篇论文提供了对 Transformer-based 语言模型内部工作进行解释的当前技术的简明技术介绍,重点讨论生成式只解码器架构。我们最后总结了这些模型实现的已知内部机制的综合概述,揭示了该领域中流行方法和活跃研究方向之间的联系。
PDF
2 months ago
关于语音到文本和大型语言模型集成的仅解码器架构
该研究介绍了 Speech-LLaMA,一种将声学信息有效地整合到基于文本的大型语言模型中的新方法,并进一步探索了仅解码器架构在语音处理任务中的应用。
PDF
a year ago
ICLR
通过长序列摘要生成维基百科
通过抽取式摘要识别重要信息并使用神经摘要模型生成文章及段落以及整个维基百科文章,特别是引入可扩展关注长序列的仅解码器结构,当给定参考文献时,该模型可以提取相关的事实信息。
PDF
6 years ago
Prev
Next