BriefGPT.xyz
Ask
alpha
关键词
gpu time
搜索结果 - 2
CVPR
面向语义分割的可定制化架构搜索
本文提出了一种可定制的架构搜索方法,以实现自动生成用于语义图像分割的网络架构,操作被赋予成本,并通过探索搜索空间来构建最优网络架构以满足自定义约束,该方法在 Cityscapes 和 CamVid 数据集上表现优秀,并在 Nvidia Ti
→
PDF
5 years ago
ACL
神经机器翻译体系结构的大规模探索
本研究对神经机器翻译(NMT)架构的超参数进行了首次大规模分析,并报告了标准 WMT 英德翻译任务上数百个实验结果和方差数,相当于超过 25 万 GPU 小时。通过这些实验,得出了新的见解和建议,建立了一个开源 NMT 框架,使研究人员可以
→
PDF
7 years ago
Prev
Next