BriefGPT.xyz
大模型
Ask
alpha
关键词
multimodal automated interpretability agent
搜索结果 - 1
多模态自动可解释性代理
这篇论文介绍了 MAIA,一种多模态自动解释性代理。MAIA 是一个使用神经模型自动化神经模型理解任务的系统,如特征解释和故障模式发现。它通过提供一系列工具来对其他模型的子组件进行迭代实验,从而对其行为进行解释。这些工具包括人工解释性研究人
→
PDF
2 months ago
Prev
Next