BriefGPT.xyz
Ask
alpha
关键词
planning strategies
搜索结果 - 4
m&m's: 评估多步骤多模态任务工具使用的基准
实际多模态问题很少通过单一的机器学习模型来解决,通常需要多步计算计划,涉及多个模型的组合。本文引入了一个包含 4K + 多步多模态任务的基准,其中包括 33 种工具,涵盖多模态模型、(免费)公共 API 和图像处理模块,通过使用实际工具集生
→
PDF
4 months ago
决策和控制的深度生成模型
本论文旨在研究深度模型强化学习方法的实证不足,并提出解决方案,同时探讨现代生成建模工具箱中推理技术(包括波束搜索、分类器导向抽样和图像修复等)在强化学习问题中的有效规划策略。
PDF
a year ago
小红帽环游世界:基于大型语言模型的跨语言故事策划与生成
研究跨语言故事生成中采用规划大语言模型来研究故事生成最佳方案,考虑了四种规划策略并系统分析了不同策略的输出差异,表明以问答对形式制定计划可生成更连贯的故事,同时给故事创作者更多的控制权。
PDF
2 years ago
学习宏观动作的战略性专注作家
本文提出了一种名为 STRAW 的深度循环神经网络,它能够在强化学习环境中纯交互学习构建隐含计划的网络结构,该网络结构可以分割内部表示,并学习计划持续时间,从而可以学到不同长度的高级宏操作 (Task),并且可以应用于包括 Atari 游戏
→
PDF
8 years ago
Prev
Next