BriefGPT.xyz
Ask
alpha
关键词
global performance
搜索结果 - 2
学习控制未知强单调博弈
我们提出了一种简单的算法,通过在线调整受控系数来学习将博弈的纳什均衡点转移到符合线性约束,而不需要知道奖励函数或行动集,从而提供具有概率 1 保证的收敛性以满足目标线性约束的纳什均衡集合,并为该算法提供了均方收敛速度为 O (t^{-1/4
→
PDF
6 days ago
知识引导的附加建模用于监督回归
本研究对比了传统机器学习方法和基于混合建模的方法在标准回归问题中的性能,并重点研究了混合模型的不同训练方法,结果显示混合建模方法应用于回归问题具有较高的性能表现。
PDF
a year ago
Prev
Next