Jun, 2024
基本操作区域、超参数微调和玻璃性:朝着可解释的训练受限玻尔兹曼机复制理论
Fundamental operating regimes, hyper-parameter fine-tuning and glassiness: towards an interpretable replica-theory for trained restricted Boltzmann machines
Alberto Fachechi, Elena Agliari, Miriam Aquaro, Anthony Coolen, Menno Mulder
TL;DR我们开发了一个统计力学框架来描述具有二进制可见层和高斯隐藏层的限制玻尔兹曼机,通过利用复制技巧并假设基础序参量具有自平均性(即复制对称性)来训练由噪声实现的单一基准模式的未标记数据集,我们提供了分析和数值证据,表明在超参数空间中存在一个子区域,其中发生了复制对称性的破缺。