BriefGPT.xyz
Ask
alpha
关键词
neural architecture search (nas)
搜索结果 - 3
具备 MAD 技能的预训练混合模型
Manticore 是一个自动化设计混合体系结构的框架,通过重用预训练模型创建预训练混合体,实现了语言模型选择、预训练混合体的构建以及对预训练混合体进行编程的功能,并在长距离竞技场任务上取得强大的性能。
PDF
a month ago
CVPR
CSCO:卷积算子的连接性搜索
通过最小化利用现有设计模式来创建卷积算子的有效连接,并利用发现的连接构建高性能的 ConvNets,本文提出了 CSCO,一个新颖的范例,通过神经预测器作为地面真实性能的代理引导搜索,引入图同构的数据增强来提高样本效率,并提出了 Metro
→
PDF
2 months ago
基于神经架构搜索的级联多任务自适应学习
利用神经架构搜索(NAS)框架提出一种自动且有效的自适应学习方法来优化端到端级联多任务模型,通过在每个特定模块上选择冻结、插入适配器和微调等候选自适应操作,并在损失函数中添加了一个惩罚项限制学习结构,成功地压缩优化参数至相当于全微调的 8.
→
PDF
8 months ago
Prev
Next