BriefGPT.xyz
大模型
Ask
alpha
关键词
transformer large language models
搜索结果 - 4
新闻历史回顾:利用语义搜索连接过去与现在
使用 News Deja Vu 这一语义搜索工具,借助 Transformer 大型语言模型和双编码器方法,识别与现代新闻查询最相似的历史新闻文章,以揭示看似独特于现在的现象在历史上的多样性,为社会科学家提供了一个强大工具,帮助他们探索人们
→
PDF
11 days ago
蟒蛇状态空间模型可成为强大的下游学习模型
研究论文通过对 Mamba 状态空间模型进行多种实验和评估,证明了其在混合精度和参数高效微调方面的能力,同时还分析了其在上下文学习方面的性能与 Transformer 大型语言模型的差异,并提出了基于动力学系统理论的验证方法。
PDF
a month ago
变形金刚何时能够通过抽象符号进行推理?
调查了 Transformer 大型语言模型在涉及抽象符号的关系推理任务中的能力。对于 (i) 回归任务,我们证明了 Transformer 在训练时具有泛化性,但需要大量的训练数据;对于具有符号标签的 (ii) 下一个令牌预测任务,我们展
→
PDF
9 months ago
信仰与命运:变形金刚在组合性上的局限性
本研究旨在探讨 Transformer 大型语言模型在复合任务上的局限性,研究结果表明 Transformer 模型虽然具有出色的多步推理性能,但其解决复合任务的方式是将多步推理化简为线性子图匹配,而并未完全发展出解决问题的系统性解决问题的
→
PDF
a year ago
Prev
Next