BriefGPT.xyz
大模型
Ask
alpha
关键词
expressive capabilities
搜索结果 - 5
ICML
探索从认知到表达的 LLM 之旅
该研究以百川 - 7B 和百川 - 33B 为焦点,深入探讨大型语言模型的认知和表达能力在预训练、监督微调和强化学习三个关键阶段的发展规律,揭示了认知能力在预训练阶段建立,而表达能力主要在微调和强化学习阶段提升的顺序性发展模式,并探索了这些
→
PDF
a month ago
3DBench:可扩展的 3D 基准测试和指令调优数据集
评估多模态大型语言模型(MLLMs)的性能,集成点云和语言,面临重大挑战。缺乏全面评估阻碍确定这些模型是否真正代表进步,从而妨碍该领域的进一步发展。我们引入了可扩展的 3D 基准测试和大规模指令调整数据集 3DBench,提供了一个全面评估
→
PDF
2 months ago
基于多项式的注意力机制的表示能力
通过理论分析高次多项式注意力机制的表达能力,我们指出高次多项式对于放大大值和区分数据集方面的更高效性,为在注意力机制中引入更高次多项式以捕捉复杂的语言关联提供了理论依据。
PDF
8 months ago
基于 Datalog 的流推理语言的正式比较(扩展版)
通过比较 LARS 程序及 LDSR 语言的表达能力,本文找出了各自的限制条件并确定了它们可以相互表达的片段。
PDF
2 years ago
DropGNN:随机删除提升图神经网络的表达能力
本文介绍了一种新的 Dropout Graph Neural Networks 方法,通过多次运行 GNN 并在每次运行中随机独立地删除一些节点,从而克服了标准 GNN 框架的局限性,并证明了该方法在区分 GNN 不能分开的各种图形邻域方面
→
PDF
3 years ago
Prev
Next