BriefGPT.xyz
大模型
Ask
alpha
关键词
rl framework
搜索结果 - 5
自适应强化学习规划:利用大规模语言模型进行复杂信息提取
大规模语言模型在信息提取任务中存在问题,通过两阶段多步骤方法和强化学习框架提高其表现,将顺序提取视为马尔可夫决策过程,训练决策模型以提供最佳的实体提取顺序,有效改善大规模语言模型的信息提取能力。
PDF
15 days ago
学习巡回:运算符设计用于解决方案可行性映射的接送旅行推销员问题
本文旨在开发一种用于一类特殊旅行推销员问题(TSP)的学习方法,即接送 TSP(PDTSP),该方法通过一系列一对一接送节点找到最短路径。我们利用可行解算空间中的操作符来解决 PDTSP,这些操作符将一个可行解映射到另一个可行解,从而限制解
→
PDF
2 months ago
RLLTE: 强化学习的长期演进项目
RLLTE 是一个长期演进、极其模块化和开源的强化学习(RL)研究和应用框架,它通过提供大量组件来加速算法开发和演化,并构建了一个完整且丰富的生态系统,包括模型训练、评估、部署、基准测试平台和大型语言模型(LLM)辅助驾驶器。RLLTE 有
→
PDF
9 months ago
最终折扣时序逻辑反事实经验重播
通过使用可期折扣技术的价值函数代理来找到最大概率满足 LTL 规范的策略,以及通过对不同满足 LTL 规范的方法进行反事实推理来生成脱离政策的数据的新体验重演方法,该论文在离散和连续状态操作空间中进行的实验证实了反事实经验回放方法的有效性。
PDF
a year ago
JORLDY:一个完全可定制的强化学习开源框架
本文介绍了一种名为 JORLDY 的开源强化学习框架,提供了超过 20 种使用广泛的 RL 算法和多种 RL 环境,支持 PyTorch 平台,并支持算法组件自由定制,有助于推进 RL 领域的进一步发展。
PDF
2 years ago
Prev
Next