BriefGPT.xyz
大模型
Ask
alpha
关键词
crate
搜索结果 - 2
为视觉领域扩展白盒变压器
CRATE-$\alpha$ 是一种基于稀疏推理的白盒变换器架构,通过对 CRATE 结构进行小幅改进和轻量级训练,能够实现较大模型规模和数据集的可扩展性,同时保持模型的可解释性和提高模型性能,例如在 ImageNet 分类上的准确率达到
→
PDF
a month ago
极简白盒变压器下的分割算法出现
使用 CRATE 模型,在最小化的有监督训练过程中,展现了分割性质的出现,表明白盒模型的设计路径可以同时实现高性能和数学完全可解释性。
PDF
10 months ago
Prev
Next