BriefGPT.xyz
大模型
Ask
alpha
关键词
neural scaling law
搜索结果 - 3
基于大型语言模型的多智能体协作的扩展
通过研究多智能体协作中增加智能体的性能以及神经扩展定律,本文提出了多智能体协作网络(MacNet)作为一种组织智能体并通过拓扑排序优化其交互推理的方法,实验证明 MacNet 在各种网络拓扑中表现优异,并且支持超过一千个智能体之间的协作;此
→
PDF
23 days ago
神经缩放法则的动力学模型
神经网络的表现在训练时间、数据集大小和模型大小上预测性地提高,这一现象被称为神经缩放定律,而计算最优缩放定律则是将性能作为计算单元函数以选择模型大小来报告的;研究表明,神经网络在训练早期以 $1/ extit {width}$ 的速度收敛到
→
PDF
5 months ago
LLMs 学习动力系统的控制原则,揭示上下文中的神经缩放定律
预训练的大型语言模型(LLMs)在进行零 - shot 任务(包括时间序列预测)时表现出惊人的效果,本文研究了 LLMs 在从事受物理规律控制的动力系统情景下外推行为的能力,结果显示 LLaMA2 在无需微调或提示工程的情况下能准确预测动力
→
PDF
5 months ago
Prev
Next