BriefGPT.xyz
大模型
Ask
alpha
关键词
multiple environments
搜索结果 - 4
ICML
多环境下部分识别的治疗效果的元学习器
从多环境的观测数据中,利用部分识别法通过元学习器估计条件平均治疗效应的边界。
PDF
a month ago
结构灵活的神经网络:为普适智能体进化构建模块
人工神经网络用于强化学习是结构僵化的,参数只能固定在预定义的网络结构中,这限制了在不同环境中优化参数的能力。在本研究中,我们通过演化一组神经元和可塑突触来解决这个问题,展示了通过优化不同的随机结构配置下的神经元的参数,可以解决多个强化学习控
→
PDF
3 months ago
多环境场景下的预测推理
在多个环境下进行预测的情况中,我们解决了构建有效置信区间和集合的挑战。通过扩展自助法和分割一致性方法,我们研究了适用于这些问题的两种覆盖类型,展示了如何在这些非传统的分层数据生成场景中获得无分布覆盖。我们还在非实数值响应的设置中进行了扩展,
→
PDF
3 months ago
通用策略的不变因果模仿学习
基于多个环境中的行为演示来学习模仿策略,通过学习跨域不变的特征表示,构建与专家行为匹配的模仿策略,以实现在未见环境中的泛化能力。
PDF
8 months ago
Prev
Next