BriefGPT.xyz
Ask
alpha
关键词
statistical constraints
搜索结果 - 4
DSAC-C: 基于约束的最大熵算法用于鲁棒离散软演员评论家
我们提出了一种新颖的 Soft Actor-Critic(SAC)算法扩展。基于最大熵原理,我们认为通过从替代性评论策略中得出的附加统计约束,可以进一步改进离散 SAC 算法。此外,我们的研究结果表明,这些约束对于潜在领域转移提供了额外的稳
→
PDF
8 months ago
MaxEnt Loss: 基于约束的最大熵法在外样本分布变化下的校准
介绍了一种解决超出分布校准问题的新损失函数,基于最大熵原理,通过加入在训练过程中观察到的有帮助的统计约束,实现更好的模型校准而不损失准确性,理论分析和实验证明了该方法在合成和现实世界基准上取得了最先进的校准效果。
PDF
8 months ago
带有部分反馈的在线分类的机会均等性
研究了一种在线分类问题,其中个体按固定但未知的分布一个接一个地到达,并必须被分类为积极或消极,算法只有在他们获得正分类时才会观察到个体的真实标签。该设置捕捉到许多分类问题,要求算法满足公平性约束.
PDF
5 years ago
MM
超可靠低时延车联网传输:基于极值理论方法
本文研究了在车辆之间网络中,基于曼哈顿机动性模型的功率最小化问题,同时考虑延迟和可靠性等二阶统计限制,最终提出了两种队列感知的功率分配方案,在降低队列最大长度的均值和方差方面取得了较优的结果。
PDF
6 years ago
Prev
Next