BriefGPT.xyz
Ask
alpha
关键词
personalized policies
搜索结果 - 2
KDD
可解释的个性化实验
本文介绍了 Meta 公司实现和部署生产环境中可扩展、可解释的个性化实验系统,用于学习对黑盒异质性处理效果模型的解释和生成可解释的个性化政策,并在公共数据和 Meta 使用案例上评估系统中使用的方法并讨论开发系统过程中的经验教训。
PDF
3 years ago
PerSim:基于个性化模拟器的异构智能体数据高效离线强化学习
本文提出基于模型的离线强化学习方法 PerSim 来解决数据稀缺性问题,通过学习每个智能体的个性化模拟器来提高性能并同时学习个性化策略。
PDF
3 years ago
Prev
Next