BriefGPT.xyz
Ask
alpha
关键词
misunderstanding
搜索结果 - 2
政策梯度算法是否真的是梯度算法?
全球顶级会议发表的论文中存在误导性,关于 drop state distribution 中的折扣因素对于算法的影响,一些方法没有优化折扣奖励函数,因为它们优化的是逼近 Most method 更新方向的不可微、不存在导函数的函数,因此这些
→
PDF
5 years ago
MM
关于 “深度与廉价学习为何如此有效” 的评论
本文主要针对 Lin 和 Tegmark 最近发表的论文 “为什么深度和廉价学习如此有效?” 进行反驳,指出他们的反例并不成立,是基于对 Kadanoff 所提出的变分 RG 程序的误解,而且其反例可以与之前的研究兼容。
PDF
8 years ago
Prev
Next