BriefGPT.xyz
Ask
alpha
关键词
regression-based algorithm
搜索结果 - 4
离线目标条件强化学习的 $f$- 优势回归方法
提出了一种新的基于回归的离线 GCRL 算法 GoFAR,通过状态匹配方法解决了目标达成任务问题,并充分利用价值函数和策略网络的优势,在离线性能和稳定性方面表现优异。GoFAR 的训练目标还可以用于纯离线数据学习无特定环境的目标条件规划器,
→
PDF
2 years ago
ICML
基于正则化状态占据匹配的多功能离线从观测和示例中模仿
这篇论文提出了一种新颖的离线模仿学习算法 SMODICE,它是一种基于回归的算法,通过状态占据匹配得到,并且能够有效地应用于三种离线模仿学习设置:从观测模仿、动态或形态不匹配的模仿以及基于示例的强化学习。研究者通过 Fenchel 对偶和解
→
PDF
2 years ago
一遍 AUC 最优化
本研究提出一种基于回归的算法和一种随机算法,用于一次遍历训练数据集并进行 AUC 优化,可以高效地处理高维数据,并且只需要在内存中维护训练数据的前两阶统计量。
PDF
11 years ago
高维混合图模型
本文提出了一种适用于混合数据的图模型,该模型对高维数据来说简单而灵活,采用回归算法和群体套索惩罚法来拟合模型,并将其应用于 CAL500 音乐注释数据集,成功得到了将音频信号的连续特征与流派、情感和用途等分类变量之间关系的稀疏而可解释的图模
→
PDF
11 years ago
Prev
Next