BriefGPT.xyz
Ask
alpha
关键词
objective
搜索结果 - 3
AAAI
泛化规划环境重构
环境设计中,通过对环境进行改变来影响其他个体的决策。本论文提出了一种通用环境重设计方法,不依赖具体指标以及不同目标,通过利用最新的高质量规划研究,有效地根据任何感兴趣个体的目标和指标优化规划环境。实验证明,在使用熟知的指标(如目标识别)以及
→
PDF
5 months ago
强化学习目标的一般视角
该论文提出了一种泛化的强化学习目标函数,其中包括标准的目标定义、扩展的 λ 回报版本和通过统一前两个版本提出的强化学习的目标函数,它可以高级地理解强化学习的目标,并连接一些广泛使用的强化学习技术(例如 TD (lambda) 和 GAE),
→
PDF
a year ago
ACL
无增强数据的文本生成数据增强
该文提出一种没有使用特定映射函数构造数据增强数据的方法来解决文本生成任务中的数据增强问题,该方法可以有效地优化并应用于文本生成任务的流行损失函数,收敛速率得到保证,实验结果证明该方法可以达到甚至超过流行的数据增强方法。
PDF
3 years ago
Prev
Next