BriefGPT.xyz
Ask
alpha
关键词
model knowledge
搜索结果 - 2
专家不作弊:通过预测对来学习未知知识
通过训练模型来预测真实条件分布,并估计模型与真实条件分布之间的差异,并通过欺骗策略和二阶校准检测错误响应,准确估计模型对模糊图像分类、语言建模和部分可观测导航任务中的不确定性。
PDF
5 months ago
从 RDDL 到 Gym 环境的 pyRDDLGym
pyRDDLGym 是一个 Python 框架,可以通过 RDDL 描述自动生成 OpenAI Gym 的环境,支持模型知识以及多个实体和不同配置。它可以帮助强化学习领域快速开发新的基准,且便于基于交互式学习实现混合方法的研究。
PDF
2 years ago
Prev
Next