BriefGPT.xyz
大模型
Ask
alpha
关键词
implementation details
搜索结果 - 4
RLeXplore: 加速内在动机驱动的强化学习研究
在复杂环境中,由于设计和注释的高人力成本,外部奖励通常无法满足需求,这强调了内在奖励的必要性,通过提供辅助和密集的信号使代理能够无监督学习。本研究引入了一个统一的、高度模块化且可插拔的框架 RLeXplore,提供了八种先进内在奖励算法的可
→
PDF
a month ago
SERL: 一套用于样本高效的机器人强化学习的软件套件
我们开发了一种精心实现的库,其中包含一种样本高效的离线深度强化学习方法,以及用于计算奖励和重置环境的方法,一个广泛采用的机器人的高质量控制器,和几个具有挑战性的示例任务。我们希望这些有希望的结果和我们的高质量开源实现将为机器人学界提供一个工
→
PDF
5 months ago
EMNLP
Transformer 修改能否在不同实现和应用间转移?
本文综合评估了 Transformers 架构的许多修改,并发现大多数修改并没有显著的改善性能。作者推测性能的提高可能严重依赖于实现细节,并相应地提出了一些改进实验结果通用性的建议。
PDF
3 years ago
ICLR
渐进式增长 GAN 以提高质量、稳定性和变化性
通过渐进增加模型层数的方法,生成对抗网络在训练中实现速度和稳定性的提升,并取得了空前的图像质量和变异性,同时提出了新的 GAN 结果评估指标,取得实验成功。(keywords 中包含:生成对抗网络、逐步增长、图像质量、Inception 分
→
PDF
7 years ago
Prev
Next