BriefGPT.xyz
大模型
Ask
alpha
关键词
task knowledge
搜索结果 - 2
利用大型语言模型学习物理技能的奖励
使用大型语言模型通过环境反馈提取任务知识,为物理技能创建高效的奖励函数。方法包括利用语言模型提出奖励函数的特征和参数,然后通过迭代自对准过程更新这些参数,使语言模型与学习到的奖励函数的排名一致,通过在三个模拟物理技能学习任务中的测试验证了方
→
PDF
8 months ago
AAAI
利用语言模型作为认知代理的知识来源
利用大型语言模型作为认知系统的任务知识、认知代理和知识提取,以及通过整合提取与认知架构能力来提高知识提取效果的挑战和机会。
PDF
10 months ago
Prev
Next