BriefGPT.xyz
Ask
alpha
关键词
dac
搜索结果 - 3
ICLR
通过提升实现对抗模仿学习
通过建立加权回放缓冲区的新算法 AILBoost,该文研究了对抗性模仿学习在离策略训练中的有效性,实验证明 AILBoost 相较于 DAC 在控制器状态和像素环境中性能更佳。
PDF
3 months ago
通过激活树突连接改善神经网络性能
本研究介绍了一种基于预激活和多个偏差的新型计算单元 DAC,用于减轻神经网络中多个单元共享输入偏差的问题,并在 ResNet 架构中测试 DAC 卷积,取得了最高 1.73% 的性能提升。
PDF
2 years ago
合作通信的语义时代:通过离线强化学习加速模拟以接近真实
提出一种称为 AoS 的信令更新语义新鲜度的度量方式,针对节点更新源和目的地之间的状态更新的最优控制策略进行研究,提出了在线和离线的深度演员 - 评论家算法,离线算法在数据集质量方面表现出强大的鲁棒性。
PDF
2 years ago
Prev
Next