Mar, 2021

战略分类实践

TL;DR本文介绍了一种实用的针对策略性分类的学习框架,利用微分求解了用户的策略反应,从而直接最小化了 “策略性” 经验风险,并且证明了该方法在各种学习场景下的有效性。