BriefGPT.xyz
Ask
alpha
关键词
decision-making policies
搜索结果 - 2
ICML
通过双机器学习学习决策策略的工具变量
利用双 / 去偏机器学习框架设计的 DML-IV 算法,有效减小两阶段 IV 回归中的偏差并学习高性能策略。
PDF
2 months ago
基于异构知识的增强模块化强化学习
通过使用调解者选择异质性模块和平稳地融合不同类型的知识,提出了增强型模块化强化学习 (AMRL) 框架,并引入了选择机制的变体,即记忆增强型调解者,以利用时间信息,评估结果表明增强传统模块化 RL 的其他形式的异质知识可以提高性能
PDF
a year ago
Prev
Next