BriefGPT.xyz
大模型
Ask
alpha
关键词
hiro
搜索结果 - 2
HIRO:分层信息检索优化
使用分层信息检索优化(HIRO)的查询方法,通过使用层次化结构来存储文档,从而减少返回给 LLM 的上下文并减少信息损失,提高了模型的性能。
PDF
20 days ago
NIPS
数据效率的分层强化学习
本文研究如何构建通用且高效的层次强化学习算法,其中较低层的控制器通过自动学习和提出的目标来实现上级控制器的监督,并使用脱离策略的经验来提高效率。我们称此算法为 HIRO,并在模拟机器人上的实验中表现出高性能和高样本效率。
PDF
6 years ago
Prev
Next