BriefGPT.xyz
Ask
alpha
关键词
text-based reinforcement learning
搜索结果 - 2
关于对文本驱动强化学习应用微调语言模型效果的研究
本文研究了基于文本的强化学习,讨论了语义理解和语言能力对强化学习代理的训练效率以及在类似语义训练游戏中的表现的影响,旨在为文本强化学习情景下的代理微调开发更好的策略。
PDF
3 months ago
ACL
学习抽象意义表达式的符号规则用于文本强化学习
通过结合语义解析器和规则归纳系统,我们提出了一个模块化的 NEuro-Symbolic Textual Agent(NESTA),该模型能够学习抽象可解释的规则作为策略,并在文本游戏基准测试中表现出更好的泛化能力和更少的训练交互。
PDF
a year ago
Prev
Next