BriefGPT.xyz
Ask
alpha
关键词
model uncertainties
搜索结果 - 3
ProbSAINT:用于二手车定价的概率表格回归
用车定价受经济因素和市场动态的影响,自动化定价算法的不确定性在应用中面临复杂挑战,ProbSAINT 模型提供了准确定价和不确定性量化的方法,适用于预测不同预期交易期限的价格概率。
PDF
4 months ago
实用鲁棒强化学习:邻域不确定性集和双代理算法
介绍了一种新的不确定性集合并基于此提出了一种名为 ARQ-Learning 的鲁棒强化学习方法,同时还提出一种能高效解决 ARQ-Learning 在大规模或连续状态空间下的问题的技术,最终将其应用于各种存在模型不确定性的强化学习应用中。
PDF
a year ago
鲁棒受限制马尔科夫决策过程:在模型不确定性下进行软受限制鲁棒策略优化
本文介绍了一个基于 Constrained Markov Decision Process(CMDP)和 Robust Markov Decision Process(RMDP)的框架,即 Robust Constrained-MDPs(R
→
PDF
4 years ago
Prev
Next